Machine Learning / AI
В чем разница между кластерными и некластерными индексами?
Есть градиентный бустинг и случайный лес на 1000 деревьев. Что будет с качеством каждой модели, если удалить первое построенное дерево?
С какой даты вы готовы начать сотрудничество в случае положительного решения?
Что такое GCN (Graph Convolutional Network) и его формула обновления?
Расскажите про архитектуру ViT (Vision Transformer): как картинка превращается в последовательность токенов?
Какая вероятностная интерпретация у ROC-AUC?
У кого эффект будет более негативный при удалении первого дерева: у модели бустинга или бэггинга?
Что такое kalman filter и где он применяется?
Как считать sample size для A/B-теста?
Для чего используется spaCy для генерации векторов?
Почему cosine similarity чаще предпочтительнее, чем евклидово расстояние, для семантического поиска?
Какие особенности ранжирования вакансий и резюме?
Что такое observability стека данных?
Сколько циклов нужно для сортировки и объединения списков без лямбда-функций?
Что такое FlashAttention и какой выигрыш по памяти он даёт?
Расскажите про идею ResNet и напишите код ResidualBlock.
Почему чаще всего используется B-tree индекс и какая у него алгоритмическая сложность?
Какие модели распознавания строк (CRNN, TrOCR)?
Что такое uplift modeling и чем он отличается от response modeling?
Что такое overlap между чанками и зачем он нужен?