deepsea _拜读未来科技摆渡人生

DeepSeek爆火一个月，豆包、Kimi们怎么样了？

1月20日，前后相隔仅几小时的时间里，深度求索与月之暗面先后发布了技术路径相似的DeepSeek-R1及Kimi K1.5多模态思考模型。

后来，OpenAI在论文里称，这两家中国AI公司同时独立发现了o1（OpenAI o1推理模型）的秘密。

但从结果来看，二者南辕北辙。前者名声大噪，改写全球AI格局，后者却并没有太大声量。

18 0 2025-09-05

文明不应只是给强者以机会，更应给弱者体面。

这两天，韩束母公司上美股份创始人吕义雄的一段工作群中的聊天截图在社交媒体上疯传。

在聊天截图中，吕义雄表达了激进的用人策略，即用AI替代大部分人，只留少量能够使用AI的人。

比如法务部门50%的人要淘汰，只留20%能用AI的人；客服部门95%的人要淘汰，只留5%能用AI的人；新品创新中心70%的人要淘汰，只留30%能用AI的人......

17 0 2025-09-03

DeepSeek引爆国产适配的前夜，「硅基流动」已完成亿元融资 | 智涌首发

有人预料到DeepSeek能引爆全球吗？至少，DeepSeek-V3发布前，在大模型战场前线“卖铲子”的袁进辉心里也是打鼓的。

1月28日，他在社交媒体上回忆起一个故事：DeepSeek爆火前一个月，梁文锋曾建议硅基流动部署DeepSeek-V3，至少准备20台H800，80台最好。袁进辉迅速算了算账，一个月80台H800服务器就要支出五六百万的算力成本，这些机器还不一定能用满。“风险太大了，就没下注。”

16 0 2025-09-02

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。

紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向DeepSeek的人才。

这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，

22 0 2025-09-01

众所周知，大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」，开发者利用大规模文本数据集训练模型，让它学会预测句子中的下一个词。第二阶段是「后训练」，旨在教会模型如何更好地理解和执行人类指令。

在 LLM 后训练阶段，似乎是一个强化学习的特殊形式。用于大语言模型（LLMs）微调的强化学习（RL）算法正沿着一条明确的演进路径持续发展。

19 0 2025-09-01