Machine Learning / AI
Что дает понимание контекста трансформерами?
Что такое distribution drift и как его обнаружить (KS-test, PSI)?
Можно ли в Python задать дефолтное значение аргумента функции списком и какие проблемы это может вызвать?
Что такое skeleton-of-thought prompting?
Считается ли пробел символом в задаче?
Как работает MapReduce и происходит распределение данных на воркеры и объединение результатов?
Что такое дроп-аут и как он реализуется?
Что такое stratified sampling в экспериментах?
Что такое stochastic depth и зачем он в EfficientNet?
В чем разница между методами map и apply в pandas?
Что такое COG (Cloud-Optimized GeoTIFF)?
Что такое offline RL и какие у него подводные камни?
Почему сеть с BatchNorm сходится быстрее?
Какова формула градиента для MSE по весам?
Спроектируйте систему семантического поиска по корпоративной документации на 1М документов.
Какая функция потерь используется в бустинге для классификации и регрессии?
Какие особенности обучения сегментации на изображениях высокого разрешения?
Почему перед тестированием модели нужно перевести модель в режим инференса (model.eval())?
Как работает функция zip в Python и какие у неё ключевые аргументы?
Что такое propensity score и его использование (matching, IPW)?