Каталог задач
87 задач из 1000. Страница 1 из 2. Тестовые задания с реальных собеседований по аналитике и алгоритмам.
001
Python — длина самой длинной серии одинаковых символов
PythonСтроки и итерацияЛёгкаяJuniorМагнит
002
Python/pandas — построение воронки из событий
PythonPandas и аналитикаСредняяMiddleАвито / классика
003
Python — слить пересекающиеся события одного пользователя
Pythonpandas / алгоритмыСредняяMiddleAviasales / классика
004
Python — Union-Find для связанных записей по id/phone/mail
PythonGraph / Union-FindСложнаяMiddleСбер
005
Retentioneering: момент времени, после которого человек спит с вероятностью 0.9
PythonКвантили и доверительные интервалыСредняяMiddleRetentioneering
006
Retentioneering: анализ эффективности товаров в Яндекс.Маркете (DRR/ROAS)
PythonМаркетинговая аналитикаСредняяMiddleRetentioneering
007
Aviasales Aviastats — ETL: разворот flights_info в строки
PythonETL и подготовка данныхСредняяMiddleAviasales
008
Aviasales Booking — Pandas: pivot по сопутствующим услугам
PythonPandas и аналитикаСредняяMiddleAviasales
009
Aviasales Junior — рефакторинг исследовательского скрипта для регулярного запуска
PythonЧистый код и регулярные джобыСредняяJuniorAviasales
010
Python (senior) — Итератор vs генератор: в чём разница
PythonСтруктуры языкаСредняяSeniorЯндекс / классика
011
Магнит Python — длина наибольшей последовательности одинаковых символов
PythonАлгоритмы и строкиЛёгкаяJuniorМагнит
012
EasyBrain — кумулятивные показы рекламы по дням жизни когорты
PythonCohort / cumulative metricsСредняяMiddleEasyBrain
013
MediaScope — почасовая динамика телесмотрения с разнесением сессий по интервалам
PythonTime series / segmentationСредняяJuniorMediaScope
014
Amazon: сохранить LIST на диск — сложность и память
PythonСериализацияЛёгкаяJuniorAmazon
015
Technesis: чистка и дедуп данных по гостиницам с двух платформ
PythonETL и data cleaningСредняяMiddleTechnesis
016
ВК Junior: DPU и NPU по транзакциям из Excel
PythonExcel и pandasЛёгкаяJuniorВК
017
ДКД МО ДЗМ: Excel/Python — анализ заболеваний COVID-19 по поликлиникам
PythonExcel и pandasЛёгкаяJuniorГКУ ДКД МО ДЗМ
018
Градус: извлечение бренда и подбренда из наименования товара
PythonПарсинг текстаСредняяMiddleГрадус
019
Красный Яр / 585: прирост средней конверсии (LFL по магазинам СПб)
PythonExcel и pandasЛёгкаяJuniorКрасный Яр / 585
020
Росмэн: прогноз продаж и оборачиваемости с помощью коэффициентов сезонности
PythonПрогнозированиеСредняяJuniorРосмэн
021
Совкомбанк Страхование: преобразование медицинского реестра
PythonETL и pandasЛёгкаяJuniorСовкомбанк Страхование
022
Совкомбанк Страхование: VBA / Python — извлечь город из адреса
PythonПарсинг текстаЛёгкаяJuniorСовкомбанк Страхование
023
Karpov ДЗ: Retention curve на pandas
PythonpandasСредняяJuniorKarpov.Courses
024
Karpov ДЗ: Прогноз CLTV для подписочного сервиса
PythonCLTV / CohortСложнаяMiddleKarpov.Courses
025
Хабр Python — разница Series и DataFrame в pandas
Pythonpandas основыЛёгкаяJuniorХабр
026
Хабр Python — groupby с несколькими агрегатами и named aggregation
PythonpandasСредняяMiddleХабр
027
Хабр Python — merge, join, concat в pandas: что выбрать
PythonpandasСредняяJuniorХабр
028
Хабр Python — стратегии заполнения пропусков (fillna, dropna, ffill)
PythonpandasСредняяJuniorХабр
029
Хабр Python — pivot_table для отчёта по категориям и месяцам
PythonpandasСредняяMiddleХабр
030
Хабр Python — поиск аномалий в дневной выручке через rolling mean
PythonpandasСредняяMiddleХабр
031
Хабр Python — list comprehension, map, filter и когда что выбирать
PythonPython базовыйЛёгкаяJuniorХабр
032
Хабр Python — изменяемый аргумент по умолчанию (mutable default)
PythonPython базовыйЛёгкаяJuniorХабр
033
Хабр Python — почему не нужно итерировать DataFrame через iterrows
Pythonpandas производительностьЛёгкаяJuniorХабр
034
Хабр Python — дедупликация заказов с правилом «оставить самый поздний»
PythonpandasСредняяJuniorХабр
035
LeetCode Pandas — выручка по месяцам и приросты MoM
Pythonpandas — даты и группировкаСредняяJuniorLeetCode
036
LeetCode Pandas — top-N продуктов по выручке в каждой категории
Pythonpandas — top-N per groupСредняяMiddleLeetCode
037
LeetCode Pandas — forward fill по группам и проверка хвостов
Pythonpandas — пропускиСредняяJuniorLeetCode
038
LeetCode Pandas — pivot выручки по регионам и кварталам
Pythonpandas — pivotСредняяJuniorLeetCode
039
LeetCode Pandas — merge_asof: time-based join по последней цене
Pythonpandas — time-joinСложнаяSeniorLeetCode
040
InterviewQuery Pandas — RFM-сегментация через qcut
Pythonpandas — сегментацияСредняяMiddleInterviewQuery
041
InterviewQuery Pandas — конверсия воронки и drop-off
Pythonpandas — воронкиСредняяMiddleInterviewQuery
042
DataInterview Pandas — wide → long через melt и tidy data
Pythonpandas — reshapeЛёгкаяJuniorDataInterview
043
alexeygrigorev/data-science-interviews: FizzBuzz
PythonБазовый алгоритмЛёгкаяJuniorGitHub: alexeygrigorev/data-science-interviews
044
alexeygrigorev/data-science-interviews: палиндром
PythonСтрокиЛёгкаяJuniorGitHub: alexeygrigorev/data-science-interviews
045
alexeygrigorev/data-science-interviews: посчитать RMSE без библиотек
PythonМетрики качестваЛёгкаяJuniorGitHub: alexeygrigorev/data-science-interviews
046
alexeygrigorev/data-science-interviews: Jaccard similarity
PythonМетрики сходстваЛёгкаяJuniorGitHub: alexeygrigorev/data-science-interviews
047
alexeygrigorev/data-science-interviews: посчитать IDF по корпусу
PythonNLPСредняяMiddleGitHub: alexeygrigorev/data-science-interviews
048
alexeygrigorev/data-science-interviews: PMI пар слов
PythonNLPСредняяMiddleGitHub: alexeygrigorev/data-science-interviews
049
alexeygrigorev/data-science-interviews: удалить дубликаты из списка
PythonСтруктуры данныхЛёгкаяJuniorGitHub: alexeygrigorev/data-science-interviews
050
alexeygrigorev/data-science-interviews: подсчёт элементов
PythonСтруктуры данныхЛёгкаяJuniorGitHub: alexeygrigorev/data-science-interviews