Machine Learning / AI
Что такое Tesseract и где у него границы качества?
Какую лосс функцию применять при обучении модели?
Как ROC-AUC работает на данных, где есть сильный дисбаланс классов?
Можно ли заменить свёртку 3x3 на две последовательные свёртки 3x1 и 1x3? В чём выигрыш и потери?
Что такое p-value?
Какие риски bias amplification?
Какие параметры в случайном лесу можно изменить и как влияют глубина и количество деревьев?
Как работают BatchNorm и LayerNorm? Преимущества и недостатки каждой и где применяются?
Что такое CUDA и какие основные понятия (kernel, grid, block, thread)?
Почему практически перестали использовать большие свёртки 9x9, 7x7, 5x5?
Какие виды сортировок вы знаете и какие у них сложности по времени и памяти?
Задача: что эффективнее по скорости — подать в трансформер 2 входа по 512 токенов по отдельности (2x512) или объединить их в 1x1024?
Сколько факторов подавать на вход CatBoost?
Какие проблемы могут возникать при использовании функции активации Sigmoid вместе с BatchNorm?
Чем стемминг отличается от лемматизации? В каких задачах какое применять?
Что такое метрика MAP?
Что такое линейная регрессия?
Какие способы кодирования категориальных признаков существуют?
Какие ускорения инференса достигаются?
Из каких частей состоит Stable Diffusion (SD)?