Machine Learning / AI
Что такое LLM-агент? Чем он отличается от prompt-chain пайплайна?
Приходилось ли работать с асинхронностью?
Какие приёмы предотвращения переобучения в boosting (subsample, colsample, min_child)?
Как организовать хранилище данных с учетом данных из нескольких источников: бэкенд базы, кликстрим, CRM и коммуникации?
Как обеспечить безопасность данных при RAG (PII, права доступа)?
Какой лосс использовать при дисбалансе классов?
Чем DataParallel отличается от DistributedDataParallel в PyTorch?
Какие виды JOIN существуют в SQL и чем отличаются left join, right join и inner join?
Какие ещё диффузионные модели существуют кроме Stable Diffusion?
Какие еще методы борьбы с переобучением кроме дропаута существуют?
У кого эффект будет более негативный при удалении первого дерева: у модели бустинга или бэггинга?
Что такое selection bias и survivorship bias?
Сравните Qdrant, Milvus, Weaviate, Pinecone, pgvector по фичам и характеристикам.
Как организовать контейнеризацию и развёртывание моделей?
Что такое source separation (Demucs, Spleeter)?
Почему ансамбль из нескольких деревьев лучше одного дерева?
Что означает каждое слагаемое в функции потерь Faster R-CNN: loss_classifier, loss_objectness, loss_rpn, loss_bbox?
Что такое долгосрочная память агента и как её строить (summarization, vector memory)?
Как контролировать качество данных в проектах?
На какую зарплату вы рассчитываете?