Machine Learning / AI
Какой масштаб данных в базе и кликстриме?
Какой функционал оптимизируется при обучении логистической регрессии?
Можно ли дешево исправить проблему использования модуля в градиентном спуске?
Что такое parent-document retriever и зачем он нужен?
Какие проблемы при бэктесте моделей временных рядов?
Чем занимаешься на факультете?
Что такое TD3 и какие три улучшения он вносит в DDPG?
Какая разница между PCIe и SXM формами GPU?
Что такое SAC (Soft Actor-Critic) и зачем maximum entropy RL?
Как добавление одинаковых значений ко всем объектам влияет на метрики классификации?
Что такое judge LLM и какие у него bias-проблемы (length bias, position bias)?
Какие особенности прогноза с праздниками и редкими событиями?
Делался ли дроп-аут с опорой на лосс или случайным выкидыванием весов?
Что такое behavioral cloning vs DAgger?
Как обрабатываются непрерывные признаки в решающих деревьях?
Какие метрики используются для OCR?
Что такое grouped-query attention (GQA) и зачем она нужна?
Почему регуляризация помогает бороться с переобучением?
В чем разница между доменным именем и IP-адресом как endpoint?
Как отслеживать полноту загрузки данных?