
90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!
90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!
大语言模型长序列文本生成效率新突破——
生成10万Token的文本,传统自回归模型需要近5个小时,现在仅需90分钟!

18
0
2025-09-01