Machine Learning / AI
Нормально ли работать одному над проектом?
Как вычислить вероятность выпадения решки при условии наличия фальшивой монеты с двумя решками?
Какие приёмы дешевле human eval (LLM-as-a-judge, model-graded)?
Что такое A/A-тест и зачем он нужен?
Чем QLoRA отличается от LoRA?
Какая задача решается с помощью BERT и CRF?
Что такое IPO, KTO, ORPO как альтернативы DPO?
Что такое beam search и почему его редко используют для open-ended generation?
Чем отличается prompting инструктивных моделей и базовых LM?
Что такое adversarial validation и зачем она нужна?
Что означает изменяемость и неизменяемость объектов в Python?
Как работает дроп-аут в нейронных сетях?
Как провести кросс-валидацию на временных рядах?
Нужно ли ставить shuffle в DataLoader?
Какие задачи бизнеса решает survival analysis (churn, оборачиваемость)?
Что такое Monte Carlo Data?
Какие оптимизаторы кроме Adam существуют и в чем их разница?
Как получить рекомендации из матрицы взаимодействий?
Что такое search budget и как его планировать?
Какой тип JOIN используется по умолчанию при написании просто JOIN?