neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。


第一个项目,果然与推理加速有关。


北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。

21 0 2025-09-01
DeepSeek V3 – DeepSeek开源的最新版 AI 模型,编程能力超越Claude

DeepSeek V3 – DeepSeek开源的最新版 AI 模型,编程能力超越Claude

DeepSeek V3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的表现超越了Claude 3.5 Sonnet V2等竞争对手。DeepSeek V3采用了高达6850亿参数的混合专家(MoE)架构,包含256个专家,使用sigmoid路由方式,每次选取前8个专家参与计算,模型能更高效地处理复杂任务。
25 0 2025-08-28
DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON

DeepSeek Engineer – 开源AI编程助手,处理用户对话生成结构化JSON

DeepSeek Engineer 是集成DeepSeek API 的AI编程助手,基于命令行界面让用户能读取本地文件、创建新文件及实时对现有文件进行差异编辑。DeepSeek Engineer用 Pydantic 进行类型安全的文件操作,遵循系统提示确保所有回应都以 JSON 格式输出,同时支持文件的创建和编辑。DeepSeek Engineer 能帮助开发者在对话中引用文件内容,生成代码或提出差异编辑建议。
27 0 2025-08-28
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库

DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库

DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE)分组的GEMM操作,基于即时编译(JIT)技术,无需安装时编译,支持在运行时动态优化。
26 0 2025-08-28
DeepClaude –  开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型

DeepClaude – 开源AI应用开发平台,深度集成 DeepSeek R1 和 Claude 模型

DeepClaude 是高性能的开源 AI 工具,基于深度集成 DeepSeek R1 和 Claude 两大模型,结合推理、创造力和代码生成能力。DeepClaude提供零延迟的即时响应,支持端到端加密和本地 API 密钥管理,确保用户数据安全。DeepClaude 高度可配置,用户能自定义 API 和界面,满足多样化需求。
23 0 2025-08-28