Machine Learning / AI
Какие deep learning подходы к survival analysis (DeepSurv, DeepHit)?
В чем разница DWH и Data Lake?
Какие особенности работы с датами и временем в Python и какие есть библиотеки для работы с timedelta?
CLIP: идея, функция потерь, способ обучения, для чего используется. Какие метрики дистанции между эмбеддингами можно использовать и какую применяли авторы?
Что делать, если в списках совпадают точки по таймштампу?
Почему в нейронных сетях редко используют сигмоиду как функцию активации?
Что обычно спрашивают на финальном собеседовании?
Как эффективно искать похожие эмбеддинги среди миллионов товаров с помощью Faiss или других индексов?
Чем отличается AutoML для табличных данных от CV/NLP?
Почему нужно использовать функцию LEAD для поиска будущих значений по id в SQL?
Что такое SSP и DSP?
Есть ли данные для проверки решения или нужно создавать тестовые данные самостоятельно?
Как учитывается контекст в современных моделях?
Что такое self-consistency CoT?
Какова роль text-encoder (CLIP) в Stable Diffusion?
Что такое NCCL и за что он отвечает?
Как поступать, если доход клиента неизвестен?
Как делать бинаризацию факторов, например возраста?
Какие особенности при оценке качества browse-агентов (WebArena)?
Что такое router LLM и зачем направлять запросы на разные модели?