Условие
Есть сайт-доска объявлений (как Циан, Авито, AliExpress). Не привязываемся к конкретному функционалу. Предложить набор показателей, оценивающих качество базы объявлений.
Решение
Что значит «качество»
В классифайдах база — это сердце продукта. «Качество» = насколько объявления:
- Свежие — реальные, актуальные, не подвисшие.
- Полные — содержат все нужные поля и фото.
- Достоверные — не дубликаты, не фейк, цена в рынке.
- Релевантные — у объявления есть просмотры/контакты, а не «пустышка».
- Конвертируемые — сделка по ним всё-таки случается.
Дальше каждую группу разворачиваем в конкретные метрики.
Группа 1. Полнота и формат
- Доля объявлений с фото (target ≥ 95%).
- Среднее число фото на объявление.
- Доля заполненности обязательных полей: цена, площадь, район, контакт. Желательно мерить как отдельные метрики и аггрегатно «фулл-комплектность».
- Доля объявлений с описанием > N символов (мера усилий продавца).
- Геокодирование: доля объявлений с распознанным адресом / координатами.
Группа 2. Актуальность (свежесть)
- Возраст объявления — медиана и распределение по дням «висит на сайте».
- Доля свежих объявлений (создано за последние 7/30 дней).
- Время до первой модерации.
- Доля объявлений, снятых самим продавцом (ушёл с сайта — продал? передумал?).
- Доля объявлений, по которым продавец давно не заходил (signal of stale).
Группа 3. Достоверность
- Доля дубликатов (по фото-перцептивному хешу, по тексту, по контактам).
- Доля объявлений, заблокированных модерацией (как абсолютная, так и среди новых).
- Доля жалоб от пользователей на 1000 объявлений.
- Отклонение цены от медианы по сегменту (фейк-цены приманивают трафик).
- Доля «отказников» — объявлений, по которым после звонка обнаруживается, что объект уже продан.
Группа 4. Спрос и интерес
- CTR на выдаче — сколько людей кликают, увидев в списке.
- Просмотры на объявление — медиана, распределение.
- Контакты (звонки/чаты) на объявление — главная метрика «полезности».
- Доля объявлений, по которым 0 контактов за 30 дней — «мёртвый груз».
Группа 5. Сделки (если есть данные)
- Доля объявлений, закрытых по причине «продал».
- Среднее время до сделки.
- Конверсия «контакт → сделка» (если есть feedback-механизм).
Сводный индекс
Если нужно одно число — взвешенный индекс по группам с весами от бизнеса (например, freshness 30%, полнота 20%, контакты 30%, доля жалоб 20%). Полезен для дашборда «качество базы по городам».
Срезы
Все показатели бессмысленны без срезов:
- по категории (квартиры/комнаты/коммерция),
- по городу/региону,
- по типу продавца (физик / агент / агентство),
- по тарифу (бесплатное / платное / премиум),
- по новизне аккаунта (новые продавцы — больше фейка).
Подводные камни
- Перекос на «процент с фото». Высокая доля фото — это базовый гигиенический минимум, не отличие. Главные метрики качества — про спрос (контакты, конверсия в сделку).
- «Дубликаты» не определены однозначно. Один и тот же объект могут публиковать риелтор и хозяин — это не фрод, но дубликат. Нужны разные определения для разных задач.
- Региональные нормы. В Москве «10 фото на объявление» норма, в маленьком городе — редкость. Сравнивать без разреза по геo нечестно.
- Survivorship bias. Если мерять «среднее число просмотров на живое объявление», старые «пустые» автоматически удаляются и метрика выглядит лучше, чем есть.
- Фокус на продавца, а не на покупателя. Качество базы — это и про релевантность поиску. Можно добавить метрику «доля объявлений в выдаче, которые соответствуют введённому фильтру».
- Один индекс — обманчивая агрегация. Локальная просадка фотографий теряется. Дашборд должен показывать как индекс, так и составляющие.
Эталонный ответ
Метрики качества группируем в 5 направлений:
- Полнота — фото, обязательные поля, описание, геокодирование.
- Актуальность — медианный возраст, доля свежих, время до модерации, активность продавца.
- Достоверность — дубликаты, жалобы, отклонение цены, доля «уже продано».
- Спрос — CTR, просмотры, контакты, доля «мёртвых».
- Сделки — закрытие по причине «продано», время до сделки.
В каждом блоке — несколько KPI, на дашборде — сводный индекс + разрезы по категории, городу, типу продавца. На собеседовании важно подчеркнуть, что метрики качества базы для классифайда — это не только «зеркало содержимого» (полнота), но и востребованность (контакты).