Machine Learning / AI
Как организовать хранилище данных с учетом данных из нескольких источников: бэкенд базы, кликстрим, CRM и коммуникации?
Какие методы дебиасинга датасета (reweighting, resampling)?
Что подавать в качестве запроса для поиска?
Что такое мульти- и гиперспектральные снимки?
Сталкивались ли с дрейфом данных?
Как выбрать символ при нескольких максимальных подряд идущих символах?
Чем двухстадийные детекторы отличаются от одностадийных по архитектуре, скорости и качеству?
Чем DataParallel отличается от DistributedDataParallel в PyTorch?
Какие ещё диффузионные модели существуют кроме Stable Diffusion?
Что должно присутствовать у объекта, чтобы он был итератором в Python?
Как реализуется параллельность в Python с учётом GIL (multiprocessing, потоки, asyncio, C-расширения)?
Что такое mixed precision training (FP16, BF16)?
Какие особенности медицинских изображений (DICOM, KT, МРТ)?
Что такое операция свёртки? Какие у неё свойства? Как её можно представить в виде матричного умножения (im2col)?
Что такое replica и shard в распределённой VDB?
На какую зарплату вы рассчитываете?
Какие особенности anomaly detection в time series (STL residuals, ESD)?
Применяли ли методы для увеличения выборки или пробивки данных?
Работали ли вы с Great Expectations и dbt tests для проверки качества данных?
Что такое Latent Diffusion Models (Stable Diffusion)?