Machine Learning / AI
Что такое multilingual embeddings и как они обучаются (LaBSE)?
Что такое drift detection и как он связан с anomaly detection?
Как измеряется и описывается сложность алгоритмов?
Что такое retrieval с гибридным скором (dense + sparse) и зачем смешивать?
Какие подходы к interpretability для compliance?
Что будет если сделать select 1 вместо названия колонки?
Что такое key-information extraction (KIE)?
Как заказчик может понять, что признак незначим без использования feature importance в модели черный ящик?
Чем отличаются авторегрессивные и маскированные языковые модели?
Какие данные из звонилок хранятся: метаданные или аудио/видео записи?
Что такое pivoted normalization?
Что такое semi-supervised learning и self-training?
В чем разница между Series и DataFrame в pandas?
Что такое query log mining и какие сигналы извлекают?
Как реализовать слияние двух отсортированных массивов в один отсортированный?
Какие риски AutoML с точки зрения интерпретируемости?
Какие подходы можно использовать для улучшения качества модели после достижения базового результата?
Какие знаете оптимизаторы (SGD, Momentum, RMSProp, Adam, AdamW)? В чём идеи и различия?
Какие метрики оценки качества аудио-генерации (FAD, MOS)?
Что такое collaborative filtering и какие базовые алгоритмы (user-based, item-based)?