Machine Learning / AI
Что такое foundation модели для временных рядов (Chronos, TimesFM, Lag-Llama)?
Как устроен механизм внимания в трансформерах?
Что такое GPT-4V и какие у него реальные применения?
Зачем нужен data augmentation?
Как формируются instruction datasets для SFT?
Какие ансамблевые методы используют глубокие деревья?
Что такое Triton (OpenAI) и где он применяется?
Что такое GNN explainability (GNNExplainer)?
В чем разница между семантической сегментацией, инстанс-сегментацией и детекцией объектов?
Какие особенности safety при ML-управлении роботом?
Как реализовать реверс массива без использования компиляции?
Как учитывать ситуацию, когда смешной ответ имеет много лайков, но не является правильным?
Как работает SQL запрос с полным набором полей без агрегатных функций и GROUP BY по этим же полям?
Что такое mixup и cutmix? Как влияет на регуляризацию?
Можно ли использовать линейную регрессию в условиях смещения выборки?
Как вы попали в сферу машинного обучения?
Почему в промышленной среде чаще используют градиентный бустинг, а не случайный лес?
Какие особенности обучения LLM на 100+ GPU (failure rate, checkpointing)?
Как совместить RAG с tool use и function calling?
Какие метрики используются для сегментации и детекции объектов?