Machine Learning / AI
Какие архитектурные тренды у современных decoder-only LLM (LLaMA, Mistral, Qwen)?
Как BERT улавливает семантическую схожесть между разными по написанию, но одинаковыми по смыслу предложениями?
Зачем нужна нормализация признаков?
Что такое Kaplan-Meier estimator?
Какие особенности active learning в NLP-задачах?
Как устроена архитектура U-Net?
Как считается коэффициент Джини и как он связан с ROC AUC?
Как подходить к решению SQL задачи?
Что такое class activation maps (CAM) и Grad-CAM?
Какие гиперпараметры HNSW важны (M, efConstruction, efSearch)?
Какую зависимость между переменными ищет коэффициент корреляции Пирсона?
Есть ли переработки на работе?
Как использовать кросс-валидацию для оценки модели?
Как устроено решение задачи поиска пары чисел с заданной суммой?
Что такое ConvNeXt и почему он догнал по качеству ViT?
В чем смысл MergeTree в ClickHouse и что мержится при вставке данных?
Считаются ли денежные метрики в аб-тестах?
Что такое model stealing attack?
Что такое Great Expectations и какие у него ключевые понятия?
Как BERT предсказывает скрытые слова под маской и учитывает контекст соседних слов?