Machine Learning / AI
ROC-AUC = 0.9. Что произойдёт с этой метрикой, если домножить все предсказания модели на число 3?
Решаем задачу линейной регрессии, все y > 0. Какие из перечисленных алгоритмов могут дать отрицательное предсказание: линейная регрессия, KNN, градиентный бустинг, дерево, случайный лес, нейросеть?
Что такое geohash и как его использовать как фичу?
Как семплируется шаг t при обучении и инференсе Stable Diffusion?
Какие чекапы делать при выборе learning rate для SFT LLM?
Где заканчивалась зона ответственности и был ли опыт написания продакшн кода?
Какая структура данных лежит в основе dict в Python? Как разрешаются коллизии?
Как работает Non-Maximum Suppression (NMS) и для чего он нужен?
Как должна выглядеть разметка для обучения трансформера распознавать спецтерминологию?
Какие виды свёрток вы знаете (стандартная, depthwise, separable, dilated, transposed, grouped)? Идеи, плюсы и минусы каждой.
Какие подходы к responsible scaling LLM?
Что такое словарь (dict) в Python?
Какие метрики бинарной классификации вы знаете? Плюсы и минусы каждой.
Какие методы отбора признаков существуют?
Коэффициент корреляции равен 0. Можно ли утверждать, что выборки независимы? Почему?
Какие метрики fairness вы считали в проде?
Какой алгоритм лежит в основе модели?
Как делить данные на страты для валидации?
Какие метрики важнее для оценки качества рекомендаций: precision или recall?
Что такое bagging и почему он уменьшает variance модели?