neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

刚刚,英伟达新模型上线!4B推理狂飙53倍,全新注意力架构超越Mamba 2

刚刚,英伟达新模型上线!4B推理狂飙53倍,全新注意力架构超越Mamba 2

刚刚,英伟达新模型上线!4B推理狂飙53倍,全新注意力架构超越Mamba 2

Jet-Nemotron是英伟达最新推出的小模型系列(2B/4B),由全华人团队打造。其核心创新在于提出后神经架构搜索(PostNAS)与新型线性注意力模块JetBlock,实现了从预训练Transformer出发的高效架构优化。相比Qwen3、Gemma3、Llama3.2等模型,Jet-Nemotron在数学、代码、常识、检索和长上下文等维度上准确率更高,同时在H100 GPU上推理吞吐量最高提升至53倍。

6 0 2025-09-07