Условие

Маркетинг говорит: «после запуска рекламной кампании выросла конверсия — значит, реклама работает». Какие альтернативные объяснения у этой корреляции? Как формально проверить причинность?

Решение

Альтернативные объяснения наблюдаемой корреляции

Случайность. Колебания метрики могут быть шумом, особенно на коротком горизонте.
Обратная причинность. Не реклама → конверсия, а сезонность → реклама + конверсия (запустили рекламу потому, что предполагали рост).
Конфаундер — третий фактор, влияющий на обе переменные. Например, перед чёрной пятницей и маркетинг активизируется, и пользователи в режиме покупок.
Selection bias. Реклама показана не всем — а тем, чей профиль предсказывает покупку. Часть «эффекта» это уже их склонность.
Tracking artifact. Логирование изменилось одновременно с запуском кампании.

Методы проверки причинности (от слабых к сильным)

A/B-тест — рандомизация destroy’ит конфаундеры. Золотой стандарт.
Difference-in-Differences (DiD). Сравниваем «обработанный» сегмент vs «не обработанный» до и после события.
Regression Discontinuity. Для естественных порогов (например, «премиум-клиент с >100 заказами»).
Instrumental Variables. Внешняя переменная, влияющая на treatment, но не на outcome напрямую.
Propensity Score Matching. Подбор «двойников» по характеристикам для имитации рандомизации.
Causal Inference / DAG / do-calculus. Формальный фреймворк (Перл).

Парадокс Симпсона как иллюстрация

Корреляция в данных целиком может быть противоположна корреляциям в подгруппах:

Группа	A: успех	A: всего	B: успех	B: всего
Молодые	81	87	234	270
Старые	192	263	55	80
Итого	273	350 (78%)	289	350 (83%)

В каждой возрастной группе вариант A лучше (93% vs 87%, 73% vs 69%). А в сумме — B! Причина: в B чаще попадают молодые, у которых базовая ставка успеха выше.

«Хрестоматийные» ложные корреляции

Продажи мороженого ↔ утопления (общий конфаундер — лето).
Число пожарных на пожаре ↔ ущерб (общий — масштаб пожара).
Утренние пробки ↔ дождь (вы не подумали — есть и обратный путь: «дождь меняет maintenance», и DiD-арт).

Подводные камни

«Корреляция > 0.7, значит причинно». Сила корреляции не делает её каузальной.
«Сильная теория + наблюдения = доказательство». Без рандомизации или хорошего causal-design это всё ещё гипотеза.
Симпсон-парадокс в продуктовых данных. Часто срабатывает в когортах (новые vs старые пользователи).
A/B-тест с компрометированной рандомизацией = наблюдательные данные, не RCT.
«Не нашли A/B-результата — значит, эффект нулевой». Нет — это означает «не задетектили на текущей мощности».

Эталонный ответ

Корреляция — это статистическая связь; причинность — функциональная связь. Перед причинными выводами проверяйте: случайность, обратную причинность, конфаундеры, selection bias, tracking artifacts. Золотой стандарт — A/B-тест с рандомизацией. Иначе — DiD, regression discontinuity, IV, propensity matching, причём с явной DAG.

Хабр Статистика — корреляция ≠ причинность