Machine Learning / AI
Как разбить документы на чанки? Какой размер чанка обычно выбирают?
Всегда ли spill на диск это плохо?
Что такое репликация в ClickHouse?
Как найти максимальное число в массиве, которое встречается только один раз?
Что такое таргетинг?
Какие алгоритмы снижения размерности существуют?
Расскажите про задачу машинного перевода. Что такое sequence-to-sequence?
Что такое pseudo-labeling в табличных задачах?
Чем INT8 квантизация отличается от INT4?
Что такое 3D parallelism (data + tensor + pipeline)?
Что такое candidate generation и какие подходы (BM25, dense, hybrid)?
Какие угрозы нужно было обнаруживать в системе видеонаблюдения?
Как устроен анбординг?
Какие подводные камни могут быть при нормализации данных для решения проблемы экстраполяции в случайном лесу?
Что происходит с деревом при очень большом или очень маленьком минимальном количестве объектов в листе?
Что такое альтернативная релевантность товаров в поисковой выдаче?
Перечислите основные принципы ООП?
Какие практические трюки ускоряют инференс трансформеров (speculative decoding, medusa)?
Что предсказывает U-Net в Stable Diffusion на каждом шаге?
Как проверить, на чем модель основывается?