uvision智谱_拜读未来科技摆渡人生

GLM-baidu09Realtime – 智谱推出的端到端多模态模型

GLM-Realtime是智谱推出的全新端到端多模态模型，具备低延迟的视频理解与语音交互能力，特别融入清唱功能，让大模型在对话中能展现歌唱才能。模型支持长达2分钟的内容记忆以及Function Call功能，支持灵活调用外部知识和工具，拓展应用范围。

21 0 2025-08-29

GLM-baidu09PC – 智谱推出的电脑智能体，基于CogAgent视觉多模态模型构建

GLM-PC是智谱推出的基于多模态大模型CogAgent的电脑智能体。能像人类一样“观察”和“操作”计算机，协助用户高效完成各类电脑任务，如文档处理、网页搜索、信息整理、社交互动等。GLM-PC通过代码生成与图形界面理解相结合的方式，实现逻辑推理与感知认知的深度结合，具备任务规划、执行、反思和自我纠错的能力。

27 0 2025-08-29

GLM-baidu094.5V – 智谱开源的最新一代视觉推理模型

GLM-4.5V是智谱开源的最新一代视觉推理模型。模型基于106B参数规模构建，拥有12B激活能力，是目前领先的视觉语言模型（VLM）。模型在GLM-4.1V-Thinking的基础上升级而来，继承其优秀架构，结合新一代文本基座模型GLM-4.5-Air进行训练。

21 0 2025-08-29

CogView4 – 智谱开源的AI文生图模型，支持生成汉字

CogView4 是智谱推出的开源文生图模型，具有60亿参数，支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一，达到开源文生图模型的最先进水平（SOTA）。

23 0 2025-08-28

CogView3 – 智谱AI推出的开源AI图像生成模型

CogView3是清华大学联合智谱AI推出的开源AI图像生成模型，采用中继扩散技术。模型分阶段生成图像，首先创建低分辨率图像，然后通过中继超分辨率技术提升至高分辨率，提高生成效率并降低成本。CogView3在生成质量和速度上均超越现有的开源模型SDXL，实现在保持图像细节的同时，大幅减少推理时间。

20 0 2025-08-28

CogVideoX-baidu09Flash – 智谱推出的首个免费AI视频生成模型

CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，继承CogVideoX自研的端到端视频理解模型，具备强大的视频生成能力。CogVideoX-Flash支持文生视频，依据输入的文本描述精准地生成相应的动态视频内容。

20 0 2025-08-28

CogVideoX – 智谱AI推出的开源AI视频生成模型

CogVideoX是智谱AI最新推出的开源AI视频生成模型，与智谱AI的商业产品“清影”同源。CogVideoX支持英文提示词，能生成6秒长、每秒8帧、分辨率为720*480的视频。模型推理需16-36GB显存，目前不支持量化推理和多卡推理。

19 0 2025-08-28

CogVLM2 – 智谱AI推出的新一代多模态大模型

CogVLM2是由智谱AI推出的新一代多模态大模型，在视觉和语言理解方面实现了显著的性能提升，支持高达8K的文本长度和1344*1344分辨率的图像输入，具备强大的文档图像理解能力。

20 0 2025-08-28

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30