Каталог задач
1000 задач. Страница 8 из 20. Авторские задачи для подготовки к собеседованиям аналитиков с разборами решений.
Темы
Уровень
Сложность
По мотивам интервью в
351
Стажировка ML — Разделяющая прямая (метод опорных векторов)
ML / Data ScienceSVM и геометрияСложнаяSenior
352
Стажировка ML — Банковский переполох: бинарная классификация по хешированным фичам
ML / Data ScienceБинарная классификацияСредняяMiddle
353
Стажировка ML — Инопланетный шифр: классификация семантических связей
ML / Data ScienceNLP / классификация связейСложнаяSenior
354
ВК Middle: рекомендации по таргетингу рекламы через кластеризацию/классификатор
ML / Data ScienceКластеризацияСредняяMiddle
355
DataLearn ML-101: Bias-variance tradeoff на пальцах
ML / Data ScienceОсновы MLЛёгкаяJunior
356
DataLearn ML-101: Метрика классификации — accuracy/precision/recall/F1/ROC-AUC
ML / Data ScienceМетрикиЛёгкаяJunior
357
DataLearn ML-101: Cross-validation — какая стратегия для какой задачи
ML / Data ScienceВалидацияСредняяMiddle
358
DataLearn ML-101: Кодирование категориальных фичей
ML / Data ScienceFeature engineeringСредняяMiddle
359
DataLearn ML-101: Работа с несбалансированными классами
ML / Data ScienceImbalanced learningСредняяMiddle
360
DataLearn ML-101: Отбор признаков — filter / wrapper / embedded
ML / Data ScienceFeature selectionСредняяMiddle
361
zadachi_ds: Почему kNN ломается в высоких размерностях
ML / Data ScienceCurse of dimensionalityСредняяMiddle
362
zadachi_ds: Как понять, что модель переобучилась
ML / Data ScienceДиагностикаЛёгкаяJunior
363
zadachi_ds: Логистическая регрессия vs линейный SVM
ML / Data ScienceЛинейные моделиСредняяMiddle
364
zadachi_ds: L1 vs L2 регуляризация — геометрия и эффекты
ML / Data ScienceРегуляризацияСредняяMiddle
365
Хабр ML — bias-variance tradeoff на пальцах
ML / Data ScienceОсновыСредняяMiddle
366
Хабр ML — ROC-AUC: смысл, расчёт и устойчивость к дисбалансу классов
ML / Data ScienceМетрикиСредняяMiddle
367
Хабр ML — Precision vs Recall: что выбрать в задаче антифрода
ML / Data ScienceМетрикиСредняяMiddle
368
Хабр ML — L1 vs L2 регуляризация: когда что выбирать
ML / Data ScienceРегуляризацияСредняяMiddle
369
Хабр ML — работа с дисбалансом классов в классификации
ML / Data ScienceПодготовка данныхСредняяMiddle
370
Хабр ML — кросс-валидация для временных рядов
ML / Data ScienceВалидацияСредняяMiddle
371
khangich (Intuit): спроектировать ранжирование
ML / Data ScienceML System DesignСложнаяSenior
372
khangich (Booking): автоматическое определение good value deals
ML / Data ScienceML System DesignСложнаяSenior
373
khangich (Netflix): фрод-детекция по логам логинов
ML / Data ScienceML System DesignСложнаяSenior
374
khangich (Apple): сегментация миллионов пользователей
ML / Data ScienceКластеризацияСложнаяSenior
375
khangich: как понять, что модель переобучается
ML / Data ScienceДиагностика моделейСредняяMiddle
376
khangich: что такое dropout и зачем
ML / Data ScienceНейросетиСредняяMiddle
377
khangich: batch normalization
ML / Data ScienceНейросетиСредняяMiddle
378
khangich: SGD, Adam, learning rate schedule
ML / Data ScienceОптимизацияСредняяMiddle
379
alexeygrigorev: где обычно зарыто переобучение через утечку фичей
ML / Data ScienceПодготовка данныхСредняяMiddle
380
khangich: cold-start в рекомендательных системах
ML / Data ScienceRecommender SystemsСложнаяSenior
381
khangich: ROC-AUC vs PR-AUC при дисбалансе
ML / Data ScienceМетрики качестваСредняяMiddle
382
Сценарий ML: диагностика overfitting и underfitting
ML / Data ScienceOverfitting и регуляризацияЛёгкаяMiddle
383
Сценарий ML: L1, L2 и ElasticNet — когда какую
ML / Data ScienceOverfitting и регуляризацияСредняяMiddle
384
Сценарий ML: механизм Dropout с математикой
ML / Data ScienceOverfitting и регуляризацияСредняяMiddle
385
Сценарий ML: критерии early stopping
ML / Data ScienceOverfitting и регуляризацияСредняяMiddle
386
Сценарий ML: leakage в train/val/test split
ML / Data ScienceOverfitting и регуляризацияСложнаяSenior
387
Сценарий ML: алгоритм Gradient Boosting шаг за шагом
ML / Data ScienceBoosting и ensembleСредняяSenior
388
Сценарий ML: XGBoost vs LightGBM vs CatBoost
ML / Data ScienceBoosting и ensembleСредняяSenior
389
Сценарий ML: stacking vs blending vs bagging
ML / Data ScienceBoosting и ensembleСредняяSenior
390
Сценарий ML: Isolation Forest для аномалий
ML / Data ScienceBoosting и ensembleСредняяSenior
391
Сценарий ML: bias в feature importance у Random Forest
ML / Data ScienceBoosting и ensembleСложнаяSenior
392
Сценарий ML: калибровка вероятностей (Platt, isotonic)
ML / Data ScienceМетрики и оценкаСредняяSenior
393
Сценарий ML: выбор threshold по бизнес-метрике
ML / Data ScienceМетрики и оценкаСредняяMiddle
394
Сценарий ML: F-beta vs F1 при асимметрии
ML / Data ScienceМетрики и оценкаЛёгкаяMiddle
395
Сценарий ML: Cohen's kappa для multiclass
ML / Data ScienceМетрики и оценкаСредняяMiddle
396
Сценарий ML: MAPE vs sMAPE vs MAE для прогноза
ML / Data ScienceМетрики и оценкаСредняяMiddle
397
Сценарий ML: target encoding без leakage
ML / Data ScienceFeature engineeringСложнаяSenior
398
Сценарий ML: high-cardinality categorical encoding
ML / Data ScienceFeature engineeringСредняяSenior
399
Сценарий ML: лаги и rolling features для time series
ML / Data ScienceFeature engineeringСредняяMiddle
400
Сценарий ML: TF-IDF vs BERT embeddings
ML / Data ScienceFeature engineeringСредняяMiddle