
字节开源大模型量化新思路,2-bit量化模型精度齐平fp16
字节开源大模型量化新思路,2-bit量化模型精度齐平fp16
随着深度学习大语言模型的越来越火爆,大语言模型越做越大,使得其推理成本也水涨船高。模型量化,成为一个热门的研究课题。
近日,字节跳动语音团队推出一个全新的量化思路,抛弃传统的量化范式,从数学优化的角度来对量化任务建模。文章放在了 arXiv,代码已经开源,可以一键复现文中的所有结果:
11
0
2025-09-06