Machine Learning / AI
Какие методы дебиасинга датасета (reweighting, resampling)?
Почему нельзя учиться просто на выходах в градиентном бустинге?
Почему при дистилляции важно искать похожие слои в учителе и студенте?
Как работают различные токенизаторы текста (BPE, WordPiece, SentencePiece, Unigram)?
Что такое neural codec (Encodec, SoundStream)?
Какие виды аномалий бывают (point, contextual, collective)?
Что такое GIL в Python, зачем он нужен и как работает?
Что такое Textual Inversion и чем он отличается от LoRA?
Как создать и обучить классификатор в PyTorch?
Почему точность случайного леса выше, чем у одного дерева?
Как выбрать символ при нескольких максимальных подряд идущих символах?
Что такое GCN (Graph Convolutional Network) и его формула обновления?
Что такое probabilistic retrieval model?
Что такое cuBLAS и cuDNN?
В чем разница между методами map и apply в pandas?
Что такое semi-supervised learning и self-training?
Какие подводные камни INT8-инференса (calibration dataset)?
Что такое MDP (Markov Decision Process) и какие у него компоненты?
Почему выбрано направление математика в школьной жизни?
Почему для телефонного номера лучше использовать строковый тип данных?