
斯坦福让“GPU高速运转”的新工具火了,比FlashAttention2更快
斯坦福让“GPU高速运转”的新工具火了,比FlashAttention2更快
AI算力资源越发紧张的当下,斯坦福新研究将GPU运行效率再提升一波——
内核只有100行代码,让H100比使用FlashAttention-2,性能还要提升30%。
怎么做到的?
研究人员从
22
0
2025-09-02