Собесов

Сценарий: multi-touch attribution — какую модель выбрать

Продуктовая аналитикаFunnel and conversionСложнаяSenior

Условие

Юзер увидел facebook-ad → через 3 дня кликнул на email → через неделю кликнул google-search → купил. Какому каналу засчитать конверсию?

Решение

Модели атрибуции

Модель Распределение Когда
First touch 100% первому новый канал — оценка discovery
Last touch 100% последнему дефолт в Google Analytics, переоценивает search
Linear поровну простая оценка вклада
Time decay больше близким к конверсии бренд + perf-каналы вместе
U-shape (position) 40/20/40 первому, среднему, последнему acquisition с длинным циклом
Data-driven (Shapley) по реальному incremental золотой стандарт, требует много данных
MMM (econometric) агрегатно по каналу с lag когда нет user-level (cookieless)

Пример распределения

Конверсия 1000₽, цепочка facebook → email → google:

Модель facebook email google
First 1000 0 0
Last 0 0 1000
Linear 333 333 333
Time decay (k=0.5/нед) 100 300 600
U-shape 400 200 400

Когда нужен Shapley/data-driven

Когда стоимость канала высокая и решения дорогие. Shapley считает «incremental contribution» каждого канала, перебирая порядки. Требует:

  • единого user_id через все каналы;
  • большого числа цепочек;
  • инфры — Google Analytics 360, Mixpanel, своя ML-модель.

MMM как альтернатива

Если cookieless (iOS 14+ ATT, отказ от 3rd party cookies) — user-level недоступен. MMM моделирует продажи на уровне канала через регрессию с lag/adstock:

Sales_t = α + β1·TV_t + β2·adstock(Facebook_t) + γ·season + ε

Подводные камни

  1. Last touch — дефолт почти во всех системах, но всегда переоценивает retargeting и search (они близко к конверсии «по построению»).
  2. Data-driven Shapley требует достаточного числа цепочек на канал — на маленьких рынках шумно.
  3. View-through атрибуция (показ без клика) надёжна только в walled gardens (FB, Google). В open web — нет.
  4. Attribution ≠ incrementality. Канал может быть в цепочке, но конверсия случилась бы и без него (causal incrementality надо тестировать через geo-holdout или MMM).
  5. Cross-device без deterministic ID невозможна точно — используют probabilistic (вероятностный) matching, который врёт на 20–40%.

Эталонный ответ

Дефолт last-touch врёт. Для оценки бюджета — data-driven Shapley при наличии данных или MMM при cookieless. На практике сочетают MMM (бюджет по каналам) и incrementality-тесты (causal эффект конкретной кампании).

Хочешь увидеть разбор?

Зарегистрируйся бесплатно — откроется развёрнутое решение этой задачи и ещё 4 на выбор.

Зарегистрироваться и увидеть разбор
Уже есть аккаунт? Войти