Каталог задач
1000 задач. Страница 12 из 20. Авторские задачи для подготовки к собеседованиям аналитиков с разборами решений.
Темы
Уровень
Сложность
По мотивам интервью в
551
LeetCode Pandas — выручка по месяцам и приросты MoM
Pythonpandas — даты и группировкаСредняяJunior
552
LeetCode Pandas — top-N продуктов по выручке в каждой категории
Pythonpandas — top-N per groupСредняяMiddle
553
LeetCode Pandas — forward fill по группам и проверка хвостов
Pythonpandas — пропускиСредняяJunior
554
LeetCode Pandas — pivot выручки по регионам и кварталам
Pythonpandas — pivotСредняяJunior
555
LeetCode Pandas — merge_asof: time-based join по последней цене
Pythonpandas — time-joinСложнаяSenior
556
InterviewQuery Pandas — RFM-сегментация через qcut
Pythonpandas — сегментацияСредняяMiddle
557
InterviewQuery Pandas — конверсия воронки и drop-off
Pythonpandas — воронкиСредняяMiddle
558
DataInterview Pandas — wide → long через melt и tidy data
Pythonpandas — reshapeЛёгкаяJunior
559
alexeygrigorev/data-science-interviews: FizzBuzz
PythonБазовый алгоритмЛёгкаяJunior
560
alexeygrigorev/data-science-interviews: палиндром
PythonСтрокиЛёгкаяJunior
561
alexeygrigorev/data-science-interviews: посчитать RMSE без библиотек
PythonМетрики качестваЛёгкаяJunior
562
alexeygrigorev/data-science-interviews: Jaccard similarity
PythonМетрики сходстваЛёгкаяJunior
563
alexeygrigorev/data-science-interviews: посчитать IDF по корпусу
PythonNLPСредняяMiddle
564
alexeygrigorev/data-science-interviews: PMI пар слов
PythonNLPСредняяMiddle
565
alexeygrigorev/data-science-interviews: удалить дубликаты из списка
PythonСтруктуры данныхЛёгкаяJunior
566
alexeygrigorev/data-science-interviews: подсчёт элементов
PythonСтруктуры данныхЛёгкаяJunior
567
alexeygrigorev/data-science-interviews: k-NN без библиотек
PythonML с нуляСредняяMiddle
568
alexeygrigorev/data-science-interviews: Two Sum за O(n)
PythonАлгоритмыЛёгкаяJunior
569
Сценарий: groupby с несколькими агрегациями и переименованием колонок
PythonPandas базовый workflowЛёгкаяJunior
570
Сценарий: чем pivot отличается от pivot_table и когда использовать каждую
PythonPandas базовый workflowЛёгкаяJunior
571
Сценарий: melt — перевод широкой таблицы в длинную
PythonPandas базовый workflowЛёгкаяJunior
572
Сценарий: типы merge в pandas и как они влияют на размер результата
PythonPandas базовый workflowСредняяJunior
573
Сценарий: resample временного ряда в pandas
PythonPandas базовый workflowСредняяMiddle
574
Сценарий: apply против векторизации — реальный бенчмарк
PythonВекторизация и performanceСредняяMiddle
575
Сценарий: pandas query и eval — когда дают выигрыш
PythonВекторизация и performanceСредняяMiddle
576
Сценарий: чанковая обработка CSV, который не помещается в память
PythonВекторизация и performanceСредняяMiddle
577
Сценарий: когда брать Dask, когда Polars, когда хватит pandas
PythonВекторизация и performanceСредняяMiddle
578
Сценарий: профайлинг медленного pandas-пайплайна
PythonВекторизация и performanceСредняяMiddle
579
Сценарий: дедупликация строк с правилом приоритета
PythonОчистка данныхЛёгкаяJunior
580
Сценарий: fuzzy-match для объединения справочников компаний
PythonОчистка данныхСредняяMiddle
581
Сценарий: стратегии обработки NaN — когда что
PythonОчистка данныхСредняяMiddle
582
Сценарий: типы данных в pandas — где промахи стоят дорого
PythonОчистка данныхСредняяMiddle
583
Сценарий: разношёрстные форматы дат в одной колонке
PythonОчистка данныхСредняяMiddle
584
Сценарий: сессионизация пользовательских событий с таймаутом 30 минут
PythonАнализ событийСредняяMiddle
585
Сценарий: воронка из event-стрима в pandas
PythonАнализ событийСредняяMiddle
586
Сценарий: time-since-last-event для каждой строки лога
PythonАнализ событийСредняяMiddle
587
Сценарий: gaps-and-islands в pandas — стрики и пропуски
PythonАнализ событийСложнаяMiddle
588
Сценарий: построение когортной retention-таблицы в pandas
PythonАнализ событийСредняяMiddle
589
Сценарий: numpy broadcasting — посчитать матрицу попарных расстояний без цикла
PythonNumpy и scipyСредняяMiddle
590
Сценарий: np.where, маска и np.select — что выбрать
PythonNumpy и scipyЛёгкаяJunior
591
Сценарий: scipy.stats для типичных тестов аналитика
PythonNumpy и scipyСредняяMiddle
592
Сценарий: pandas json_normalize для вложенного JSON
PythonJSON и веб-скрейпингСредняяMiddle
593
Сценарий: разбор глубоко вложенного JSON без потерь
PythonJSON и веб-скрейпингСредняяMiddle
594
Сценарий: скрейпинг таблицы с веб-страницы для еженедельного отчёта
PythonJSON и веб-скрейпингСредняяMiddle
595
Сценарий: чанки и Dask для агрегата по большим parquet
PythonOptimisation и big dataСредняяMiddle
596
Сценарий: переписать pandas-пайплайн на polars lazy
PythonOptimisation и big dataСредняяMiddle
597
Сценарий: уменьшить размер датафрейма в RAM в 5 раз
PythonOptimisation и big dataСредняяMiddle
598
Сценарий: персистить промежуточные данные в parquet — best practices
PythonOptimisation и big dataЛёгкаяMiddle
599
Сценарий: heatmap корреляций в seaborn для отчёта
PythonVisualizationЛёгкаяJunior
600
Сценарий: интерактивный график plotly для дашборда
PythonVisualizationСредняяMiddle