Условие
Маркетинг говорит: «после запуска рекламной кампании выросла конверсия — значит, реклама работает». Какие альтернативные объяснения у этой корреляции? Как формально проверить причинность?
Решение
Альтернативные объяснения наблюдаемой корреляции
- Случайность. Колебания метрики могут быть шумом, особенно на коротком горизонте.
- Обратная причинность. Не реклама → конверсия, а сезонность → реклама + конверсия (запустили рекламу потому, что предполагали рост).
- Конфаундер — третий фактор, влияющий на обе переменные. Например, перед чёрной пятницей и маркетинг активизируется, и пользователи в режиме покупок.
- Selection bias. Реклама показана не всем — а тем, чей профиль предсказывает покупку. Часть «эффекта» это уже их склонность.
- Tracking artifact. Логирование изменилось одновременно с запуском кампании.
Методы проверки причинности (от слабых к сильным)
- A/B-тест — рандомизация destroy’ит конфаундеры. Золотой стандарт.
- Difference-in-Differences (DiD). Сравниваем «обработанный» сегмент vs «не обработанный» до и после события.
- Regression Discontinuity. Для естественных порогов (например, «премиум-клиент с >100 заказами»).
- Instrumental Variables. Внешняя переменная, влияющая на treatment, но не на outcome напрямую.
- Propensity Score Matching. Подбор «двойников» по характеристикам для имитации рандомизации.
- Causal Inference / DAG / do-calculus. Формальный фреймворк (Перл).
Парадокс Симпсона как иллюстрация
Корреляция в данных целиком может быть противоположна корреляциям в подгруппах:
| Группа | A: успех | A: всего | B: успех | B: всего |
|---|---|---|---|---|
| Молодые | 81 | 87 | 234 | 270 |
| Старые | 192 | 263 | 55 | 80 |
| Итого | 273 | 350 (78%) | 289 | 350 (83%) |
В каждой возрастной группе вариант A лучше (93% vs 87%, 73% vs 69%). А в сумме — B! Причина: в B чаще попадают молодые, у которых базовая ставка успеха выше.
«Хрестоматийные» ложные корреляции
- Продажи мороженого ↔ утопления (общий конфаундер — лето).
- Число пожарных на пожаре ↔ ущерб (общий — масштаб пожара).
- Утренние пробки ↔ дождь (вы не подумали — есть и обратный путь: «дождь меняет maintenance», и DiD-арт).
Подводные камни
- «Корреляция > 0.7, значит причинно». Сила корреляции не делает её каузальной.
- «Сильная теория + наблюдения = доказательство». Без рандомизации или хорошего causal-design это всё ещё гипотеза.
- Симпсон-парадокс в продуктовых данных. Часто срабатывает в когортах (новые vs старые пользователи).
- A/B-тест с компрометированной рандомизацией = наблюдательные данные, не RCT.
- «Не нашли A/B-результата — значит, эффект нулевой». Нет — это означает «не задетектили на текущей мощности».
Эталонный ответ
Корреляция — это статистическая связь; причинность — функциональная связь. Перед причинными выводами проверяйте: случайность, обратную причинность, конфаундеры, selection bias, tracking artifacts. Золотой стандарт — A/B-тест с рандомизацией. Иначе — DiD, regression discontinuity, IV, propensity matching, причём с явной DAG.