Machine Learning / AI
Почему раньше возникала проблема исчезающего градиента?
Что такое cure model?
Что такое refiner в SDXL и его роль?
Что такое сопряжённые распределения и зачем они удобны?
Какие особенности ранжирования товаров в e-commerce (CTR, conversion, доход)?
Какие фундаментальные ограничения у LLM по reasoning?
Что такое torch.compile и какой backend он использует?
Как файнтюнить BERT под задачу классификации? Что брать из выхода?
Что такое llama.cpp и формат GGUF?
Как проверить релевантность модели на тестовых данных до выкатки в продакшн?
Что такое peeking problem и как с ним борются?
Как реализовать сортировку по дате с точностью до миллисекунд в SQL?
Можно ли использовать кластеризацию при отсутствии размеченных данных для предположения классов товаров?
Какие метрики качества агента вы отслеживаете в проде?
Стоит ли анализировать содержимое хэша идентификатора или убрать хэш?
Что такое ELECTRA и replaced token detection?
Что такое ретеншен данных?
Как происходит рост сотрудников и перформанс ревью?
Что такое DTW (Dynamic Time Warping) и где применяется?
Какие use-кейсы on-device LLM (Gemini Nano, Phi-3-mini)?