Собесов

Сценарий: аномалия в DAU — root cause анализ

Кейсы и метрикиDiagnoseСредняяMiddle

Условие

DAU вчера +30% против обычного. Хорошо или плохо? Что проверить?

Решение

Рефлекс — проверить, что это не bug в обратную сторону

Скачок такого размера так же редок, как и падение. Проверять трекинг в обе стороны.

  • Не задублилось ли (новый ETL пишет события дважды)?
  • Не сбился ли фильтр botов (без фильтра DAU взлетает)?
  • Не съели ли late arrivals (вчерашние данные сегодня выглядят больше)?

Если данные точно правильные — что случилось

Возможная причина Сигнал
Виральный тикток / PR соц. сети упоминания, new users всплеск
Конкурент упал новости об outage у конкурента
Кампания / push отправили большой events в кампании совпали
Сезонность / событие праздник, спорт-событие
Релиз с обновлением новый функционал вирусится
Партнёрский deal новая интеграция с большим партнёром

Декомпозиция DAU спайка

WITH counts AS (
  SELECT
    DATE(ts) AS d,
    COUNT(DISTINCT user_id) AS dau,
    COUNT(DISTINCT user_id) FILTER (WHERE first_seen_date = DATE(ts)) AS new_users,
    COUNT(DISTINCT user_id) FILTER (WHERE first_seen_date < DATE(ts) - 7) AS resurrected
  FROM events
  WHERE ts >= CURRENT_DATE - 14
  GROUP BY 1
)
SELECT * FROM counts ORDER BY d;
  • New users взлетели → acquisition spike (PR, viral).
  • Retained стабилен — рост за счёт нового трафика.
  • Resurrected растёт — реактивация (push, email).

Качество спайка

Спайк — это подарок или просто событие? Меряем:

  • D7 retention новых юзеров. Если хуже обычной — это «случайный трафик», не PMF.
  • Активность спайка: бросают или используют core?
  • Source: organic / paid / direct?

Spike с D7 5% (vs обычные 25%) — ловушка. Эти юзеры уйдут, оставив инфраструктурные costs.

Опасности

  • Сервера не справляются — outage при спайке.
  • Поддержка не справляется — рост tickets.
  • CAC расчёты — если paid budget вырос, неучтённый.
  • Wrong conclusions: «продукт улучшился» — нет, это спайк трафика.

Что делать

  1. Verify: правда трафик, не bug.
  2. Identify source: откуда пришли.
  3. Operations: убедиться, что инфра выдержит.
  4. Capture: онбординг для приходящих, чтобы конвертить.
  5. Measure: D7 retention для new cohort.

Подводные камни

  1. Менеджеры любят праздновать спайки. Не радоваться до подтверждения, что трафик качественный.
  2. Spike с низким quality может испортить unit-economics на следующий месяц (CAC blended ниже не значит реально cheaper).
  3. Один источник всплеска (виральный пост) скоро затухнет — не считать новой baseline.
  4. Capacity planning после spike — иногда полезно подержать сервера несколько дней.
  5. Атрибутция spike сложна — без UTM и cohort labelling потом не разберётесь, откуда пришли.

Эталонный ответ

Сначала проверить, что это не bug в обратную сторону (дубли, фильтры). Потом декомпозиция: new/retained/resurrected; source трафика; quality (D7 retention новых). Спайк без quality = проблема, не победа.

Хочешь увидеть разбор?

Зарегистрируйся бесплатно — откроется развёрнутое решение этой задачи и ещё 4 на выбор.

Зарегистрироваться и увидеть разбор
Уже есть аккаунт? Войти