Sobes.tech
Back to questions
Senior
11

Как борются с квадратичной сложностью механизма внимания (Linformer, Performer, FlashAttention, sliding-window, sparse attention)?