Войти Начать бесплатно

Каталог задач

1000 задач. Страница 12 из 20. Авторские задачи для подготовки к собеседованиям аналитиков с разборами решений.

Темы

Уровень

Сложность

По мотивам интервью в

Сортировка:По умолчанию По сложности По уровню По названию

LeetCode Pandas — выручка по месяцам и приросты MoM

Pythonpandas — даты и группировкаСредняяJunior

LeetCode Pandas — top-N продуктов по выручке в каждой категории

Pythonpandas — top-N per groupСредняяMiddle

LeetCode Pandas — forward fill по группам и проверка хвостов

Pythonpandas — пропускиСредняяJunior

LeetCode Pandas — pivot выручки по регионам и кварталам

Pythonpandas — pivotСредняяJunior

LeetCode Pandas — merge_asof: time-based join по последней цене

Pythonpandas — time-joinСложнаяSenior

InterviewQuery Pandas — RFM-сегментация через qcut

Pythonpandas — сегментацияСредняяMiddle

InterviewQuery Pandas — конверсия воронки и drop-off

Pythonpandas — воронкиСредняяMiddle

DataInterview Pandas — wide → long через melt и tidy data

Pythonpandas — reshapeЛёгкаяJunior

alexeygrigorev/data-science-interviews: FizzBuzz

PythonБазовый алгоритмЛёгкаяJunior

alexeygrigorev/data-science-interviews: палиндром

PythonСтрокиЛёгкаяJunior

alexeygrigorev/data-science-interviews: посчитать RMSE без библиотек

PythonМетрики качестваЛёгкаяJunior

alexeygrigorev/data-science-interviews: Jaccard similarity

PythonМетрики сходстваЛёгкаяJunior

alexeygrigorev/data-science-interviews: посчитать IDF по корпусу

PythonNLPСредняяMiddle

alexeygrigorev/data-science-interviews: PMI пар слов

PythonNLPСредняяMiddle

alexeygrigorev/data-science-interviews: удалить дубликаты из списка

PythonСтруктуры данныхЛёгкаяJunior

alexeygrigorev/data-science-interviews: подсчёт элементов

PythonСтруктуры данныхЛёгкаяJunior

alexeygrigorev/data-science-interviews: k-NN без библиотек

PythonML с нуляСредняяMiddle

alexeygrigorev/data-science-interviews: Two Sum за O(n)

PythonАлгоритмыЛёгкаяJunior

Сценарий: groupby с несколькими агрегациями и переименованием колонок

PythonPandas базовый workflowЛёгкаяJunior

Сценарий: чем pivot отличается от pivot_table и когда использовать каждую

PythonPandas базовый workflowЛёгкаяJunior

Сценарий: melt — перевод широкой таблицы в длинную

PythonPandas базовый workflowЛёгкаяJunior

Сценарий: типы merge в pandas и как они влияют на размер результата

PythonPandas базовый workflowСредняяJunior

Сценарий: resample временного ряда в pandas

PythonPandas базовый workflowСредняяMiddle

Сценарий: apply против векторизации — реальный бенчмарк

PythonВекторизация и performanceСредняяMiddle

Сценарий: pandas query и eval — когда дают выигрыш

PythonВекторизация и performanceСредняяMiddle

Сценарий: чанковая обработка CSV, который не помещается в память

PythonВекторизация и performanceСредняяMiddle

Сценарий: когда брать Dask, когда Polars, когда хватит pandas

PythonВекторизация и performanceСредняяMiddle

Сценарий: профайлинг медленного pandas-пайплайна

PythonВекторизация и performanceСредняяMiddle

Сценарий: дедупликация строк с правилом приоритета

PythonОчистка данныхЛёгкаяJunior

Сценарий: fuzzy-match для объединения справочников компаний

PythonОчистка данныхСредняяMiddle

Сценарий: стратегии обработки NaN — когда что

PythonОчистка данныхСредняяMiddle

Сценарий: типы данных в pandas — где промахи стоят дорого

PythonОчистка данныхСредняяMiddle

Сценарий: разношёрстные форматы дат в одной колонке

PythonОчистка данныхСредняяMiddle

Сценарий: сессионизация пользовательских событий с таймаутом 30 минут

PythonАнализ событийСредняяMiddle

Сценарий: воронка из event-стрима в pandas

PythonАнализ событийСредняяMiddle

Сценарий: time-since-last-event для каждой строки лога

PythonАнализ событийСредняяMiddle

Сценарий: gaps-and-islands в pandas — стрики и пропуски

PythonАнализ событийСложнаяMiddle

Сценарий: построение когортной retention-таблицы в pandas

PythonАнализ событийСредняяMiddle

Сценарий: numpy broadcasting — посчитать матрицу попарных расстояний без цикла

PythonNumpy и scipyСредняяMiddle

Сценарий: np.where, маска и np.select — что выбрать

PythonNumpy и scipyЛёгкаяJunior

Сценарий: scipy.stats для типичных тестов аналитика

PythonNumpy и scipyСредняяMiddle

Сценарий: pandas json_normalize для вложенного JSON

PythonJSON и веб-скрейпингСредняяMiddle

Сценарий: разбор глубоко вложенного JSON без потерь

PythonJSON и веб-скрейпингСредняяMiddle

Сценарий: скрейпинг таблицы с веб-страницы для еженедельного отчёта

PythonJSON и веб-скрейпингСредняяMiddle

Сценарий: чанки и Dask для агрегата по большим parquet

PythonOptimisation и big dataСредняяMiddle

Сценарий: переписать pandas-пайплайн на polars lazy

PythonOptimisation и big dataСредняяMiddle

Сценарий: уменьшить размер датафрейма в RAM в 5 раз

PythonOptimisation и big dataСредняяMiddle

Сценарий: персистить промежуточные данные в parquet — best practices

PythonOptimisation и big dataЛёгкаяMiddle

Сценарий: heatmap корреляций в seaborn для отчёта

PythonVisualizationЛёгкаяJunior

Сценарий: интерактивный график plotly для дашборда

PythonVisualizationСредняяMiddle