Machine Learning / AI
Что такое теорема Байеса?
Что такое DAG в Airflow?
Какие практики при перепрогоне исторических признаков (backfill)?
Что такое BM25 и какие параметры (k1, b)?
Что такое sliding window attention?
Что такое DP-SGD и как добавляется шум?
Какие методы anomaly detection для изображений (PaDiM, PatchCore)?
Какие решения предложить при росте нагрузки на систему?
Как количество данных влияет на выбор индекса для поиска?
Какая сложность по памяти и по времени у self-attention?
Что такое cold start problem (user/item) и как его решают?
Зачем 80/10/10 в маскировании BERT (mask, random, original)?
Что такое Bayesian optimization для HPO?
Что такое токен в BERT и какие варианты токенизации существуют?
Чем DiT (Diffusion Transformer) отличается от U-Net в диффузии?
Как найти самый популярный продукт в наборе данных?
Что такое релевантная рекомендация?
Спроектируйте систему оценки релевантности результатов поисковой выдачи с LLM-judge.
Были ли курсы по дискретной математике?
Какие проблемы у BERT в вопросах генерации текста?