Условие
Вы — аналитик в Додо. Доступны внутренние данные (чеки, клиенты, локации). В марте 2022 часть Макдональдсов закрылась, часть продолжала работать. Нужно ответить:
- На какие наши метрики могло повлиять закрытие конкурента?
- Оцените эффект в рублях на нашу выручку. Какую методологию использовали бы?
- Какие внешние данные по Маку можно было бы использовать?
Решение
1. Метрики, которые могло задеть
- Выручка, чеки, уникальные клиенты в магазинах Додо.
- AOV (если новые клиенты с другим чеком).
- Доля новых клиентов (first_order) — приток «экс-Маков».
- CAC (если без изменений промо, но больше первичных заказов — CAC падает).
- Plate-mix: меняется ли структура продаж (бургер-аналог? картошка?).
- Часовые профили: Мак силен на завтраке/ланче — там и ожидаем больше прироста.
- География по магазинам: эффект пропорционален «сколько Маков рядом и сколько закрыто».
- Cannibalisation у тех Додо, что далеко от Маков — должна быть нулевой (контроль).
2. Методология (Difference-in-Differences с матчингом)
Ключ: «закрытие части Маков» = квази-эксперимент. Используем DiD:
- Treatment unit: Додо-точка, в радиусе R (например, 1 км) которой минимум один Мак закрылся в марте.
- Control unit: Додо-точка, рядом с которой Маки не закрылись (но был хотя бы один работающий Мак — чтобы контроль и трит были «в одной экосистеме»).
- Pre-period: январь–февраль 2022. Post-period: март–...
- Метрика на точку×день: revenue, orders, clients_qty.
- Балансировка: проверьте параллельность трендов pre-period (placebo-test).
- Модель:
δ — каузальный эффект на единицу-период. Cluster-robust SE на уровне магазина.
- Сегментация эффекта: по часу (завтрак vs ужин), по дням недели, по типу товара.
3. Внешние данные
- Геокарты Маков (OpenStreetMap, Yandex.Maps) — кто работал/закрылся.
- Mobility data / посещаемость (Yandex.Spravochnik, Google Mobility, 2GIS) — индекс посещаемости locations.
- Press-releases Макдональдса/Вкусно и Точка — даты закрытия и переоткрытия.
- Открытые данные о выручке/QSR market share — ВТБ-Индекс, Tinkoff, GfK, Nielsen.
- App-store rank/installs Додо — рост рейтинга = сигнал спроса.
Использование: для оценки exposure (сколько ушло посетителей у каждого закрытого Мака) → распределить уход «по близости» к Додо для прогноза прироста.
Альтернативные методы
- Synthetic Control: если treatment-точек мало, синтетический контроль выгоднее DiD.
- Interrupted Time Series: на одной точке без контроля.
- Causal Impact (Bayesian Structural): автоматический CI на временной ряд.
- Geo-experiments: если есть фактический матчинг по гео.
Подводные камни
- SUTVA нарушена: контроль-Додо тоже мог получить эффект, если близко к закрытым Макам (через клиентов, которые ездят).
- Параллельные тренды нарушаются: одновременно — кризис, отъезды клиентов. DiD «вычтет» общую тенденцию через time-FE, но если Мак-локации систематически отличаются от без-Мак, эффект confounded.
- Пик в первые дни vs steady-state: важно не экстраполировать первые 2 недели на год.
- Reopening как «Вкусно и Точка»: post-period короткий, иначе эффект обнулится.
- Маркет-кампании Додо в это время: если запустили промо именно тогда — confounded.
Эталонный ответ
DiD на panel «магазин × день»: треатед — Додо рядом с закрытыми Маками, контроль — Додо рядом только с работающими; параметр δ = средний эффект на точку. Внешние данные нужны, чтобы определить exposure (сколько Маков и насколько близко) и валидировать через mobility-индексы.