Machine Learning / AI
Сохраняется ли вероятность дропаута при конвертации модели в ONNX?
Какие метрики классификации использовать при сильном дисбалансе классов?
Как объединять данные из двух баз в единую модель, например снежинку или звезду?
Зачем нужна задача look-alike?
Расскажите про XLM-R и multilingual NLP.
Что такое NSP (next sentence prediction) и почему RoBERTa отказалась от неё?
Что такое RoIAlign и почему он точнее RoIPool?
Что такое ShuffleNet и зачем там channel shuffle?
Расскажите про ControlNet и LoRA. Зачем они нужны и как устроены?
Как сравнивать качество разных эмбеддинг-моделей? Что такое MTEB?
Как эффективно проверить наличие зеркальной пары точки с противоположным иксом?
Как описать архитектуру модели случайного леса с добавленной линейной моделью для экстраполяции?
Будет ли работать код при пустой строке?
Что такое генераторы в Python и для чего они используются?
Что такое NVIDIA Nsight Compute и как его использовать?
Для чего в задачах детекции нужны anchor-боксы?
Что такое scaling laws (Kaplan, Chinchilla)? Как они связывают размер модели, данные и compute?
Что такое Aequitas / Fairlearn?
Почему в трансформерах есть ограничение на количество токенов?
Как агенту работать с очень большой схемой инструментов (function selection)?