neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

千元成本搞定专业大模型,系统优化+开源大模型是关键 - 潞晨卞正达@MEET2024

千元成本搞定专业大模型,系统优化+开源大模型是关键 - 潞晨卞正达@MEET2024

千元成本搞定专业大模型,系统优化+开源大模型是关键 | 潞晨卞正达@MEET2024

大模型元年里,哪怕是跑在趋势最前沿的基座模型厂商,都难逃算力焦虑


一方面,大模型本身由于技术特性,算力需求翻倍增长;另一方面,算力供应紧张,“一卡难求”一度成为行业普遍现象。


但与此同时,趋势不等人。

10 0 2025-09-06
5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限

5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限

5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限

只用5%的参数,数学和代码能力竟然超越满血DeepSeek?


北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型


该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。

19 0 2025-09-05