Machine Learning / AI
Что такое шардирование в ClickHouse?
Что такое BERT-as-a-reranker подход?
Расскажите про FlashAttention и какие проблемы памяти он решает.
Можно ли использовать автоэнкодер для поиска аномалий при дисбалансе классов?
Как обрабатывать пустой список на входе?
Почему выбрано направление математика в школьной жизни?
Что такое MDP (Markov Decision Process) и какие у него компоненты?
Какие подводные камни INT8-инференса (calibration dataset)?
Создать функцию, которая принимает массив чисел и возвращает строку с диапазонами последовательных чисел?
Что такое PGD атака и чем она сильнее FGSM?
Что такое self-distillation в CV?
Какие задачи могут ждать в ближайшие полгода?
Что такое chain-of-thought (CoT)?
Какие угрозы у federated learning (model inversion от gradients)?
Что такое re-ranking и cascade architecture поисковика?
Как готовить датасет предпочтений для DPO?
Как обучается модель типа SBERT с triplet loss?
Что дает понимание контекста трансформерами?
Что такое distribution drift и как его обнаружить (KS-test, PSI)?
Можно ли в Python задать дефолтное значение аргумента функции списком и какие проблемы это может вызвать?