Machine Learning / AI
Когда выбирать encoder-only, decoder-only или encoder-decoder для задачи?
Почему ROC AUC не зависит от порога сечения, а Precision зависит?
Какова суть архитектуры DSM?
Что такое prefix caching в инференсе?
Опишите цикл работы агента: thought → action → observation → ...
Что такое clipped objective в PPO?
Какие особенности диалоговых систем для русского языка?
Что такое CopyPaste augmentation?
Какие статистические методы вы знаете?
Что такое optical flow и какие методы (RAFT)?
Какие технологии и направления вам ближе всего — классический ML, DS или NLP?
Можно ли гарантировать, что линейная регрессия предсказывает значения в заданном диапазоне при любых входных данных?
Зачем нужен первичный ключ?
Что такое T5 и unified text-to-text формат?
Как работает ранняя остановка в деревьях?
Что такое guardrail metrics?
Какие особенности label collection (краудсорсинг, активное обучение)?
Что такое Unigram language model в токенизации (как в SentencePiece)?
Как обновлять риск-модель при появлении новых данных и гипотез?
Что такое curiosity-driven exploration?