Sobes.tech
Назад к вопросам
Senior
10

Как борются с квадратичной сложностью механизма внимания (Linformer, Performer, FlashAttention, sliding-window, sparse attention)?