neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

DeepSeek开源优化并行策略

DeepSeek开源优化并行策略

DeepSeek今日宣布开源优化并行策略,旨在提升V3/R1训练中的计算通信重叠。此次开源包括DualPipe和EPLB两项重要技术。DualPipe是一种双向管道并行算法,用于V3/R1训练中的计算通信重叠。它实现了向后和向后计算通信阶段的
5 0 2025-09-08
DeepSeek开源优化并行策略

DeepSeek开源优化并行策略

DeepSeek今日宣布开源优化并行策略,旨在提升V3/R1训练中的计算通信重叠。此次开源包括DualPipe和EPLB两项重要技术。DualPipe是一种双向管道并行算法,用于V3/R1训练中的计算通信重叠。它实现了向后和向后计算通信阶段的
17 0 2025-09-05
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈

就在刚刚,DeepSeek放出了开源周首日的重磅炸弹——FlashMLA。


这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核,特别针对变长序列进行了优化,目前已正式投产使用。


经实测,FlashMLA在H800 SXM5平台上(CUDA 12.6),在内存受限配置下可达最高3000GB/s,在计算受限配置下可达峰值580 TFLOPS。

19 0 2025-09-02
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。


第一个项目,果然与推理加速有关。


北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。

21 0 2025-09-01
DeepSeek-baidu09V2.5 – DeepSeek开源的融合通用和代码能力的AI模型

DeepSeek-baidu09V2.5 – DeepSeek开源的融合通用和代码能力的AI模型

DeepSeek-V2.5 是DeepSeek推出的融合通用与代码能力的全新开源模型。保留了之前 Chat 模型的通用对话能力以及 Coder 模型的代码处理能力,更好地对齐了人类的偏好,并且在写作任务、指令跟随等多个方面实现了显著的提升。DeepSeek-V2.5 现在可以通过网页端和 API 全面使用,已开源至HuggingFace,便于开发者使用和二次开发。

26 0 2025-08-28
DeepSeek V3 – DeepSeek开源的最新版 AI 模型,编程能力超越Claude

DeepSeek V3 – DeepSeek开源的最新版 AI 模型,编程能力超越Claude

DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的表现超越了Claude 3.5 Sonnet V2等竞争对手。DeepSeek V3采用了高达6850亿参数的混合专家(MoE)架构,包含256个专家,使用sigmoid路由方式,每次选取前8个专家参与计算,模型能更高效地处理复杂任务。
25 0 2025-08-28
DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON

DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON

DeepSeek Engineer 是集成DeepSeek API 的AI编程助手,基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑。DeepSeek Engineer用 Pydantic 进行类型安全的文件操作,遵循系统提示确保所有回应都以 JSON 格式输出,同时支持文件的创建和编辑。DeepSeek Engineer 能帮助开发者在对话中引用文件内容,生成代码或提出差异编辑建议。
27 0 2025-08-28
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库

DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库

DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE)分组的GEMM操作,基于即时编译(JIT)技术,无需安装时编译,支持在运行时动态优化。
26 0 2025-08-28
DeepClaude –  开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型

DeepClaude – 开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型

DeepClaude 是高性能的开源 AI 工具,基于深度集成 DeepSeek R1 和 Claude 两大模型,结合推理、创造力和代码生成能力。DeepClaude提供零延迟的即时响应,支持端到端加密和本地 API 密钥管理,确保用户数据安全。DeepClaude 高度可配置,用户能自定义 API 和界面,满足多样化需求。
23 0 2025-08-28