Machine Learning / AI
Что такое self-attention?
Что такое мультиколлинеарность признаков? Чем она опасна и как её обнаруживать?
Как расширять целевую аудиторию?
Что такое GraphSAINT?
Что такое person-specific метрики (CrowdHuman)?
Как решать проблему отсутствия нужной информации в данных?
Что такое discretization (binning) непрерывных признаков и зачем?
Какие особенности работы с PII при подготовке датасета?
Что такое inverted index и какие структуры данных используются?
Как избежать запятой в конце строки при формировании результата?
В чем разница между мультитредингом и мультипроцессингом в Python?
Как реализовать сортировку по дате с точностью до миллисекунд в SQL?
Что такое gradient scaling и зачем оно нужно с FP16?
Что делают с кодом из Jupyter ноутбука дальше?
Достаточно ли использовать одну фичу суммы кредита или нужно увязать ее с другими признаками?
Зачем нужен Spark и как он работает?
Чем быстрее поиск в словаре или в списке и почему?
Что такое sequence parallelism?
Можно ли использовать кластеризацию при отсутствии размеченных данных для предположения классов товаров?
Какие слои работают по-разному во время обучения и инференса?