英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
Epoch AI上个月刚刚发文
19
0
2025-09-01
OpenReasoning-Nemotron是英伟达开源的一系列推理能力强大的大型语言模型(LLM),基于DeepSeek R1 0528 模型蒸馏而成,参数规模涵盖1.5B、7B、14B和32B。
25
0
2025-08-30
OpenMath-Nemotron是英伟达推出的一系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathReasoning进行训练,包含54万个独特问题及320万个长推理解决方案。
24
0
2025-08-30
Nemotron-CC是NVIDIA团队推出的大型预训练数据集,能将Common Crawl数据转化为适用于长序列预训练的高质量语料。Nemotron-CC数据集结合分类器集成、合成数据重述和减少启发式过滤器依赖等方法,实现数据量和质量的更好平衡。
20
0
2025-08-30
英伟达打响“小模型”第一枪-电子发烧友网综合报道 , 近日,Nvidia 推出了一款新的小型语言模型 Nemotron-Nano-9B-v2,该模型在多项基准测试中表现优异,且用户可灵活控制其推理功能的开关。 该模型以 Nemotron-H 系列为基础,融合了 Mamba 和 Transformer 架构。其中,Mamba 架构引入的选择性状态空间模型(SSM),能够以线性复杂度处理长信息序列,在内存和计算开销方面更具优势;压缩后的模型可在 A10G GPU 上运行,适用于智能终端、工业设备等低功耗环境。 据悉,Nemotron-Nano-9B-v2 的处理速
20
0
2025-08-29