Условие
В колоде 52 карты тасуют. Сколько в среднем «совпадений», когда карта на позиции i — это i-я по номеру?
Решение
Linearity of expectation
X = X_1 + X_2 + ... + X_n
E[X] = Σ E[X_i]
Линейность работает независимо от независимости.
Решение задачи
X_i = 1 если на позиции i стоит карта номер i, иначе 0.
P(X_i = 1) = 1/52 для каждой позиции i
E[X_i] = 1/52
E[X] = 52 × 1/52 = 1
В среднем — одно совпадение при любой колоде из n карт это всегда 1.
Coupon collector
Сколько в среднем покупок шоколадок нужно, чтобы собрать все 10 разных вкладышей?
T_k = число покупок, чтобы получить новый вкладыш, когда у вас уже есть k разных.
T_k ~ Geometric((n-k)/n) → E[T_k] = n / (n-k).
E[T] = Σ E[T_k] = n × (1/n + 1/(n-1) + ... + 1/1) = n × H_n
Для n=10: E[T] ≈ 10 × 2.93 ≈ 29 покупок.
Birthday paradox через expectation
В группе из 23 человек — какова вероятность совпадения дат рождения? Известный результат ≈ 50%.
Через expectation:
E[пар с совпадением] = C(23,2) × 1/365 = 253/365 ≈ 0.69
Это не вероятность (>1 невозможно), но даёт оценку «много пар».
Variance аналогично
Var(X + Y) = Var(X) + Var(Y) + 2·Cov(X, Y)
Если независимы — Cov = 0, складываются. Но для зависимых — обязательно учитывать ковариацию.
Подводные камни
- Linearity E[X+Y] = E[X] + E[Y] всегда работает; для variance — только при независимости.
- E[1/X] ≠ 1/E[X] (Jensen's inequality для выпуклой 1/x: E[1/X] ≥ 1/E[X]).
- Indicator trick полезен везде, где нужно посчитать «сколько в среднем».
- Coupon collector — задача, в которой простая формула обманчиво коротка; вывод через линейность.
- Бизнес-применение: E[времени до конверсии], E[числа сессий до покупки], E[стоимости лида].
Эталонный ответ
Linearity of expectation E[ΣX_i] = ΣE[X_i] работает всегда, в т.ч. для зависимых X_i. Применять с индикаторными переменными — мощный трюк (карты, coupon collector, birthday).