Machine Learning / AI
Что такое scaling laws (Kaplan, Chinchilla)? Как они связывают размер модели, данные и compute?
Что такое Aequitas / Fairlearn?
Почему в трансформерах есть ограничение на количество токенов?
Как агенту работать с очень большой схемой инструментов (function selection)?
Что такое GAN? Какие архитектуры GAN знаете и какие использовали на практике?
Что такое Sentence Embeddings и чем они отличаются от word embeddings?
Чем отличается мультипоточность от мультипроцессности?
Что такое MuZero и чем он отличается от AlphaZero?
Решаем задачу бинарной классификации. Как изменятся метрики precision и recall, если выкинуть 10 объектов класса 0 из таргета?
Как модель помогает бизнесу?
Что такое итераторы и генераторы в Python и в чем их разница?
Что такое мульти- и гиперспектральные снимки?
Что такое disparate impact?
Чем двухстадийные детекторы отличаются от одностадийных по архитектуре, скорости и качеству?
Какие типы сканирования таблиц существуют?
Можно ли использовать (1, [1, 2]) как ключ словаря в Python? Почему?
Какой learning rate стоит использовать для большого батча, а какой для маленького? Какие правила (linear scaling rule) вы знаете?
Как обучался BERT? Что такое MLM и NSP?
Какие физические типы соединений (джойнов) существуют на физическом уровне?
Что такое Latent Diffusion Models (Stable Diffusion)?