Machine Learning / AI
Можно ли вернуть любой символ при одинаковом количестве подряд идущих символов?
Какие приёмы повышают точность маленьких LLM (Llama 3 8B, Mistral 7B) на сложных задачах?
Как работает алгоритм LightFM?
Что такое RBF kernel и его гиперпараметры?
Чем FlashAttention v2 отличается от v1?
За счет чего трансформеры получили преимущество?
Что такое Delta Lake / Iceberg / Hudi и зачем lakehouse?
В каких ситуациях лучше использовать numpy, а в каких стандартные структуры данных Python?
Почему селекты могут стать медленнее при большом количестве индексов?
Почему раньше возникала проблема исчезающего градиента?
Что такое cure model?
Что такое refiner в SDXL и его роль?
Что такое сопряжённые распределения и зачем они удобны?
Какие особенности ранжирования товаров в e-commerce (CTR, conversion, доход)?
Что такое IoU и какие у него крайние случаи?
Какие фундаментальные ограничения у LLM по reasoning?
Что такое torch.compile и какой backend он использует?
Как файнтюнить BERT под задачу классификации? Что брать из выхода?
Что такое llama.cpp и формат GGUF?
Как проверить релевантность модели на тестовых данных до выкатки в продакшн?