Machine Learning / AI
Как делить данные на страты для валидации?
Какой алгоритм лежит в основе модели?
Какие метрики fairness вы считали в проде?
Как работает Non-Maximum Suppression (NMS) и для чего он нужен?
Можно ли строить RandomForest над KNN, линейными моделями и нейросетями? Почему?
Какие библиотеки и инструменты используются для построения RAG и векторных баз данных?
Что такое LayoutLM и его версии (v1, v2, v3)?
Что такое переобучение? Какие есть способы борьбы с ним?
Что такое global average pooling и зачем он заменяет fully-connected слой?
Что такое intrinsic и extrinsic параметры камеры?
Какие подходы к распознаванию рукописного текста?
Почему ключи в словаре Python должны быть неизменяемыми и можно ли использовать изменяемые ключи?
Какие виды нормализации существуют (Batch, Layer, Instance, Group, RMSNorm)?
Какие проблемы у RLHF на практике (reward hacking, mode collapse)?
Что такое кросс-валидация и для чего она нужна?
Работали ли вы с Airflow и писали DAGи?
ROC-AUC = 0.9. Что произойдёт с этой метрикой, если домножить все предсказания модели на число 3?
Что такое bias-variance trade-off?
Gradient Descent, SGD и Mini-Batch SGD: в чём различия, плюсы и минусы каждого?
Как сделать процесс идентификации инвариантным к изменению характеристик браузера?