Собесов

Dodo Brands — оценка эффекта закрытия Макдональдсов в марте 2022

Кейсы и метрикиCausal inference / impactСложнаяJunior

Условие

Вы — аналитик в Додо. Доступны внутренние данные (чеки, клиенты, локации). В марте 2022 часть Макдональдсов закрылась, часть продолжала работать. Нужно ответить:

  1. На какие наши метрики могло повлиять закрытие конкурента?
  2. Оцените эффект в рублях на нашу выручку. Какую методологию использовали бы?
  3. Какие внешние данные по Маку можно было бы использовать?

Решение

1. Метрики, которые могло задеть

  • Выручка, чеки, уникальные клиенты в магазинах Додо.
  • AOV (если новые клиенты с другим чеком).
  • Доля новых клиентов (first_order) — приток «экс-Маков».
  • CAC (если без изменений промо, но больше первичных заказов — CAC падает).
  • Plate-mix: меняется ли структура продаж (бургер-аналог? картошка?).
  • Часовые профили: Мак силен на завтраке/ланче — там и ожидаем больше прироста.
  • География по магазинам: эффект пропорционален «сколько Маков рядом и сколько закрыто».
  • Cannibalisation у тех Додо, что далеко от Маков — должна быть нулевой (контроль).

2. Методология (Difference-in-Differences с матчингом)

Ключ: «закрытие части Маков» = квази-эксперимент. Используем DiD:

  1. Treatment unit: Додо-точка, в радиусе R (например, 1 км) которой минимум один Мак закрылся в марте.
  2. Control unit: Додо-точка, рядом с которой Маки не закрылись (но был хотя бы один работающий Мак — чтобы контроль и трит были «в одной экосистеме»).
  3. Pre-period: январь–февраль 2022. Post-period: март–...
  4. Метрика на точку×день: revenue, orders, clients_qty.
  5. Балансировка: проверьте параллельность трендов pre-period (placebo-test).
  6. Модель:
Yit=αi+τt+δ(Treatedi×Postt)+εitY_{it} = \alpha_i + \tau_t + \delta \cdot (\text{Treated}_i \times \text{Post}_t) + \varepsilon_{it}

δ — каузальный эффект на единицу-период. Cluster-robust SE на уровне магазина.

  1. Сегментация эффекта: по часу (завтрак vs ужин), по дням недели, по типу товара.

3. Внешние данные

  • Геокарты Маков (OpenStreetMap, Yandex.Maps) — кто работал/закрылся.
  • Mobility data / посещаемость (Yandex.Spravochnik, Google Mobility, 2GIS) — индекс посещаемости locations.
  • Press-releases Макдональдса/Вкусно и Точка — даты закрытия и переоткрытия.
  • Открытые данные о выручке/QSR market share — ВТБ-Индекс, Tinkoff, GfK, Nielsen.
  • App-store rank/installs Додо — рост рейтинга = сигнал спроса.

Использование: для оценки exposure (сколько ушло посетителей у каждого закрытого Мака) → распределить уход «по близости» к Додо для прогноза прироста.

Альтернативные методы

  • Synthetic Control: если treatment-точек мало, синтетический контроль выгоднее DiD.
  • Interrupted Time Series: на одной точке без контроля.
  • Causal Impact (Bayesian Structural): автоматический CI на временной ряд.
  • Geo-experiments: если есть фактический матчинг по гео.

Подводные камни

  1. SUTVA нарушена: контроль-Додо тоже мог получить эффект, если близко к закрытым Макам (через клиентов, которые ездят).
  2. Параллельные тренды нарушаются: одновременно — кризис, отъезды клиентов. DiD «вычтет» общую тенденцию через time-FE, но если Мак-локации систематически отличаются от без-Мак, эффект confounded.
  3. Пик в первые дни vs steady-state: важно не экстраполировать первые 2 недели на год.
  4. Reopening как «Вкусно и Точка»: post-period короткий, иначе эффект обнулится.
  5. Маркет-кампании Додо в это время: если запустили промо именно тогда — confounded.

Эталонный ответ

DiD на panel «магазин × день»: треатед — Додо рядом с закрытыми Маками, контроль — Додо рядом только с работающими; параметр δ = средний эффект на точку. Внешние данные нужны, чтобы определить exposure (сколько Маков и насколько близко) и валидировать через mobility-индексы.

Хочешь увидеть разбор?

Зарегистрируйся бесплатно — откроется развёрнутое решение этой задачи и ещё 4 на выбор.

Зарегистрироваться и увидеть разбор
Уже есть аккаунт? Войти