Machine Learning / AI
Какая сложность алгоритмов зависит от n или k и от чего она зависит?
Что такое CTC loss в OCR?
Как из текста получить эмбеддинги, которые пойдут на вход в трансформер?
Как использовать BERT в QA-задаче SQuAD-стиля?
Что такое TPR и FPR? Как они связаны с precision и recall?
Какая метрика важнее: precision или recall в зависимости от задачи?
Как случайный лес уменьшает влияние отдельных деревьев на итоговое предсказание?
Что такое градиентный бустинг? Где там появляется градиент?
Какие признаки используются в классических NLP-моделях (TF-IDF, n-граммы, character n-grams)?
Расскажите про multi-head attention в деталях: что такое Q/K/V, как считаются веса внимания, зачем несколько голов.
Какие альтернативы CLIP (SigLIP, EVA-CLIP)?
Как понять, что модель недообучена или переобучена?
В чём разница self-attention и cross-attention, для чего используется каждый?
Как определяются thresholds для расчёта ROC-AUC?
Какие проблемы у функции активации Sigmoid? Где она применяется и как интерпретируется?
Что такое OOV-токен и как с ним борется subword-токенизация?
Какие требования EU AI Act к high-risk системам?
Понимают ли модели Hugging Face короткие аббревиатуры?
Что такое Dropout и как он ведёт себя на train и на inference?
Что такое model documentation (model card, datasheet)?