Войти Начать бесплатно

← Все темы

ML на собеседовании аналитика и Data Scientist

ML на собесе аналитика и DS — это не «обучи нейросеть», это понимание метрик, feature engineering, регуляризации и переобучения. Эти задачи как раз про то, что реально спрашивают.

feature engineeringметрики моделипереобучениерегуляризациякросс-валидацияROC AUC

Открыть все 90 задач по теме

Лёгкие — начни отсюда

Яндекс ML — MSE vs MAE: когда какой использовать

Loss-функцииЛёгкаяMiddle

DataLearn ML-101: Bias-variance tradeoff на пальцах

Основы MLЛёгкаяJunior

DataLearn ML-101: Метрика классификации — accuracy/precision/recall/F1/ROC-AUC

МетрикиЛёгкаяJunior

zadachi_ds: Как понять, что модель переобучилась

ДиагностикаЛёгкаяJunior

Сценарий ML: диагностика overfitting и underfitting

Overfitting и регуляризацияЛёгкаяMiddle

Сценарий ML: F-beta vs F1 при асимметрии

Метрики и оценкаЛёгкаяMiddle

Сценарий ML: class_weight в sklearn и эквиваленты

Класс дисбалансЛёгкаяMiddle

Сценарий ML: cosine vs euclidean для эмбеддингов

NLP и эмбеддингиЛёгкаяMiddle

Средние

ML — фичи RFM для модели оттока пользователей

Feature engineeringСредняяMiddle

ML — спрогнозировать бинарный target по клиентским признакам

Бинарная классификацияСредняяMiddle

Яндекс ML — L1 и L2 регуляризация: почему L1 отбирает признаки

РегуляризацияСредняяMiddle

Яндекс ML — AUC-ROC и AUC-PRC: алгоритмы построения, когда что

Метрики классификацииСредняяMiddle

Яндекс ML — Дисбаланс классов: способы борьбы

Классификация / дисбалансСредняяMiddle

Яндекс ML — Bias-Variance Decomposition: интерпретация и переобучение

Теория обученияСредняяMiddle

Яндекс ML — Кросс-валидация: на что влияет число фолдов K

Валидация моделиСредняяMiddle

Яндекс ML — Решающие деревья vs линейные модели: связь и различия

Деревья / линейные моделиСредняяMiddle

Сложные

Retentioneering: кластеризация пользователей по траекториям событий

Кластеризация и event-based аналитикаСложнаяMiddle

Яндекс ML — TwoFeatureGame: предсказать баланс матча по двум признакам

Бинарная классификацияСложнаяSenior

Яндекс ML — Утерянный язык: машинный перевод с few-shot fine-tuning

NLP / машинный переводСложнаяSenior

Яндекс ML — Заклинание продолжения: восстановить пароль через LLM

LLM / промпт-инжинирингСложнаяSenior

Skytec Games — предсказание оттока на шагах туториала

Бинарная классификация и оценкаСложнаяMiddle

Пиклема — модель прогноза скорости карьерных самосвалов по телеметрии

Time series / regressionСложнаяMiddle

Стажировка ML — Tree Barber: минимальная сумма энтропий после стрижки

Деревья решений и энтропияСложнаяSenior

Стажировка ML — Разделяющая прямая (метод опорных векторов)

SVM и геометрияСложнаяSenior

Другие темы для подготовки

SQL Python A/B-тесты Статистика и теорвер Продуктовая аналитика Алгоритмы Кейсы и метрики