Machine Learning / AI
Что такое discretization (binning) непрерывных признаков и зачем?
Как работать с кириллицей и латиницей в тексте чеков?
Как вычислить вероятность заболевания при положительном тесте с учетом чувствительности и специфичности?
Что такое seasonal-hybrid ESD?
Что такое Simpson's paradox в A/B-тестах?
Что такое feature store и какие задачи он решает (Feast, Tecton)?
Как правильно кодировать циклические признаки?
Что такое lazy вычисления в Spark?
Что такое EfficientNet и compound scaling?
Как промптом снизить hallucination в открытых вопросах?
Что такое retrieval evaluation на собственном датасете?
Что такое spatial cross-validation и зачем она нужна?
Спроектируйте систему повторного использования эмбеддингов между разными командами компании.
Как правильно сгруппировать данные по категориям зарплаты без повторяющихся строк?
Что такое occupancy и как её оптимизировать?
Расскажите про tabular Q-learning. Когда он перестаёт работать?
Какие есть подходы к построению хранилищ данных?
Что такое repair strategies в диалоге?
Какие архитектурные тренды у современных decoder-only LLM (LLaMA, Mistral, Qwen)?
Как BERT улавливает семантическую схожесть между разными по написанию, но одинаковыми по смыслу предложениями?