ML на собеседовании аналитика и Data Scientist
ML на собесе аналитика и DS — это не «обучи нейросеть», это понимание метрик, feature engineering, регуляризации и переобучения. Эти задачи как раз про то, что реально спрашивают.
feature engineeringметрики моделипереобучениерегуляризациякросс-валидацияROC AUC
Лёгкие — начни отсюда
Яндекс ML — MSE vs MAE: когда какой использовать
Loss-функцииЛёгкаяMiddle
DataLearn ML-101: Bias-variance tradeoff на пальцах
Основы MLЛёгкаяJunior
DataLearn ML-101: Метрика классификации — accuracy/precision/recall/F1/ROC-AUC
МетрикиЛёгкаяJunior
zadachi_ds: Как понять, что модель переобучилась
ДиагностикаЛёгкаяJunior
Сценарий ML: диагностика overfitting и underfitting
Overfitting и регуляризацияЛёгкаяMiddle
Сценарий ML: F-beta vs F1 при асимметрии
Метрики и оценкаЛёгкаяMiddle
Сценарий ML: class_weight в sklearn и эквиваленты
Класс дисбалансЛёгкаяMiddle
Сценарий ML: cosine vs euclidean для эмбеддингов
NLP и эмбеддингиЛёгкаяMiddle
Средние
ML — фичи RFM для модели оттока пользователей
Feature engineeringСредняяMiddle
ML — спрогнозировать бинарный target по клиентским признакам
Бинарная классификацияСредняяMiddle
Яндекс ML — L1 и L2 регуляризация: почему L1 отбирает признаки
РегуляризацияСредняяMiddle
Яндекс ML — AUC-ROC и AUC-PRC: алгоритмы построения, когда что
Метрики классификацииСредняяMiddle
Яндекс ML — Дисбаланс классов: способы борьбы
Классификация / дисбалансСредняяMiddle
Яндекс ML — Bias-Variance Decomposition: интерпретация и переобучение
Теория обученияСредняяMiddle
Яндекс ML — Кросс-валидация: на что влияет число фолдов K
Валидация моделиСредняяMiddle
Яндекс ML — Решающие деревья vs линейные модели: связь и различия
Деревья / линейные моделиСредняяMiddle
Сложные
Retentioneering: кластеризация пользователей по траекториям событий
Кластеризация и event-based аналитикаСложнаяMiddle
Яндекс ML — TwoFeatureGame: предсказать баланс матча по двум признакам
Бинарная классификацияСложнаяSenior
Яндекс ML — Утерянный язык: машинный перевод с few-shot fine-tuning
NLP / машинный переводСложнаяSenior
Яндекс ML — Заклинание продолжения: восстановить пароль через LLM
LLM / промпт-инжинирингСложнаяSenior
Skytec Games — предсказание оттока на шагах туториала
Бинарная классификация и оценкаСложнаяMiddle
Пиклема — модель прогноза скорости карьерных самосвалов по телеметрии
Time series / regressionСложнаяMiddle
Стажировка ML — Tree Barber: минимальная сумма энтропий после стрижки
Деревья решений и энтропияСложнаяSenior
Стажировка ML — Разделяющая прямая (метод опорных векторов)
SVM и геометрияСложнаяSenior