Machine Learning / AI
Что такое Tesseract и где у него границы качества?
Как ROC-AUC работает на данных, где есть сильный дисбаланс классов?
Какую лосс функцию применять при обучении модели?
Что такое p-value?
Можно ли заменить свёртку 3x3 на две последовательные свёртки 3x1 и 1x3? В чём выигрыш и потери?
Какие риски bias amplification?
Что такое CUDA и какие основные понятия (kernel, grid, block, thread)?
Как работают BatchNorm и LayerNorm? Преимущества и недостатки каждой и где применяются?
Задача: что эффективнее по скорости — подать в трансформер 2 входа по 512 токенов по отдельности (2x512) или объединить их в 1x1024?
Какие параметры в случайном лесу можно изменить и как влияют глубина и количество деревьев?
Почему практически перестали использовать большие свёртки 9x9, 7x7, 5x5?
Сколько факторов подавать на вход CatBoost?
Какие виды сортировок вы знаете и какие у них сложности по времени и памяти?
Что такое метрика MAP?
Что такое линейная регрессия?
Чем стемминг отличается от лемматизации? В каких задачах какое применять?
Какие проблемы могут возникать при использовании функции активации Sigmoid вместе с BatchNorm?
Какие ускорения инференса достигаются?
Какие способы кодирования категориальных признаков существуют?
Из каких частей состоит Stable Diffusion (SD)?