Собесов

Метрики качества базы объявлений: что измерять на доске объявлений

Кейсы и метрикиПродуктовые метрикиСредняяMiddle

Условие

Есть сайт-доска объявлений (как Циан, Авито, AliExpress). Не привязываемся к конкретному функционалу. Предложить набор показателей, оценивающих качество базы объявлений.

Решение

Что значит «качество»

В классифайдах база — это сердце продукта. «Качество» = насколько объявления:

  1. Свежие — реальные, актуальные, не подвисшие.
  2. Полные — содержат все нужные поля и фото.
  3. Достоверные — не дубликаты, не фейк, цена в рынке.
  4. Релевантные — у объявления есть просмотры/контакты, а не «пустышка».
  5. Конвертируемые — сделка по ним всё-таки случается.

Дальше каждую группу разворачиваем в конкретные метрики.

Группа 1. Полнота и формат

  • Доля объявлений с фото (target ≥ 95%).
  • Среднее число фото на объявление.
  • Доля заполненности обязательных полей: цена, площадь, район, контакт. Желательно мерить как отдельные метрики и аггрегатно «фулл-комплектность».
  • Доля объявлений с описанием > N символов (мера усилий продавца).
  • Геокодирование: доля объявлений с распознанным адресом / координатами.

Группа 2. Актуальность (свежесть)

  • Возраст объявления — медиана и распределение по дням «висит на сайте».
  • Доля свежих объявлений (создано за последние 7/30 дней).
  • Время до первой модерации.
  • Доля объявлений, снятых самим продавцом (ушёл с сайта — продал? передумал?).
  • Доля объявлений, по которым продавец давно не заходил (signal of stale).

Группа 3. Достоверность

  • Доля дубликатов (по фото-перцептивному хешу, по тексту, по контактам).
  • Доля объявлений, заблокированных модерацией (как абсолютная, так и среди новых).
  • Доля жалоб от пользователей на 1000 объявлений.
  • Отклонение цены от медианы по сегменту (фейк-цены приманивают трафик).
  • Доля «отказников» — объявлений, по которым после звонка обнаруживается, что объект уже продан.

Группа 4. Спрос и интерес

  • CTR на выдаче — сколько людей кликают, увидев в списке.
  • Просмотры на объявление — медиана, распределение.
  • Контакты (звонки/чаты) на объявление — главная метрика «полезности».
  • Доля объявлений, по которым 0 контактов за 30 дней — «мёртвый груз».

Группа 5. Сделки (если есть данные)

  • Доля объявлений, закрытых по причине «продал».
  • Среднее время до сделки.
  • Конверсия «контакт → сделка» (если есть feedback-механизм).

Сводный индекс

Если нужно одно число — взвешенный индекс по группам с весами от бизнеса (например, freshness 30%, полнота 20%, контакты 30%, доля жалоб 20%). Полезен для дашборда «качество базы по городам».

Срезы

Все показатели бессмысленны без срезов:

  • по категории (квартиры/комнаты/коммерция),
  • по городу/региону,
  • по типу продавца (физик / агент / агентство),
  • по тарифу (бесплатное / платное / премиум),
  • по новизне аккаунта (новые продавцы — больше фейка).

Подводные камни

  1. Перекос на «процент с фото». Высокая доля фото — это базовый гигиенический минимум, не отличие. Главные метрики качества — про спрос (контакты, конверсия в сделку).
  2. «Дубликаты» не определены однозначно. Один и тот же объект могут публиковать риелтор и хозяин — это не фрод, но дубликат. Нужны разные определения для разных задач.
  3. Региональные нормы. В Москве «10 фото на объявление» норма, в маленьком городе — редкость. Сравнивать без разреза по геo нечестно.
  4. Survivorship bias. Если мерять «среднее число просмотров на живое объявление», старые «пустые» автоматически удаляются и метрика выглядит лучше, чем есть.
  5. Фокус на продавца, а не на покупателя. Качество базы — это и про релевантность поиску. Можно добавить метрику «доля объявлений в выдаче, которые соответствуют введённому фильтру».
  6. Один индекс — обманчивая агрегация. Локальная просадка фотографий теряется. Дашборд должен показывать как индекс, так и составляющие.

Эталонный ответ

Метрики качества группируем в 5 направлений:

  1. Полнота — фото, обязательные поля, описание, геокодирование.
  2. Актуальность — медианный возраст, доля свежих, время до модерации, активность продавца.
  3. Достоверность — дубликаты, жалобы, отклонение цены, доля «уже продано».
  4. Спрос — CTR, просмотры, контакты, доля «мёртвых».
  5. Сделки — закрытие по причине «продано», время до сделки.

В каждом блоке — несколько KPI, на дашборде — сводный индекс + разрезы по категории, городу, типу продавца. На собеседовании важно подчеркнуть, что метрики качества базы для классифайда — это не только «зеркало содержимого» (полнота), но и востребованность (контакты).

Хочешь увидеть разбор?

Зарегистрируйся бесплатно — откроется развёрнутое решение этой задачи и ещё 4 на выбор.

Зарегистрироваться и увидеть разбор
Уже есть аккаунт? Войти