Machine Learning / AI
Какие особенности обучения LLM на 100+ GPU (failure rate, checkpointing)?
Какие метрики ранжирования существуют?
Что такое InstructBLIP?
Зачем нужен learning rate и за что он отвечает?
Что такое IP-Adapter?
Чем MMLU отличается от MMLU-Pro?
Как реализовать реверс массива без использования компиляции?
Почему индексы замедляют вставку и обновление данных?
Выбирают подмножество признаков в отдельных вершинах дерева или для всего дерева целиком?
Что такое Informer и Autoformer?
Что такое Dirichlet smoothing в языковой модели IR?
Как сделать SQL запрос для подсчета количества сотрудников в категориях зарплаты с выводом 0 для пустых категорий?
Что такое contrastive learning на графах (DGI, GraphCL)?
Для чего применяют сверточные сети в ответной системе?
Как вывести в одном датафрейме результаты по студентам с баллами по математике и биологии ниже 80?
Зачем нужны сенсоры в Airflow?
В каких случаях стоит применять двухшаговый детектор в продакшене?
Как проходит взаимодействие с командой заказчика и внутренней командой?
Можно ли использовать линейную регрессию в условиях смещения выборки?
Как учесть случаи с нулями в произведении элементов списка?