AI工具第2页_拜读未来科技摆渡人生

豆包AI视频模型 – 字节跳动推出的AI视频生成大模型：PixelDance和Seaweed

豆包AI视频模型是字节跳动推出的两款AI视频生成大模型：PixelDance 和 Seaweed 。PixelDance基于DiT结构，擅长理解复杂指令，生成连贯、多主体交互的视频片段，适合制作故事性强的短片。Seaweed则基于Transformer结构，通过时空压缩技术训练，支持多分辨率输出，生成逼真、流畅的视频，适合多种商业应用场景。PixelDance适合需要复杂动作和故事叙述的视频创作，而Seaweed则适合需要高清晰度和逼真度的视频生成。

19 0 2025-08-31

豆包3D生成模型 – 豆包推出3D生成模型，自然语言交互实时生成3D场景图

豆包3D生成模型是豆包推出的3D生成模型，属于豆包大模型家族。模型基于3D-DiT 架构，能生成高质量 3D 模块。与火山引擎数字孪生平台 veOmniverse 结合使用，能高效完成智能训练、数据合成和数字资产制作，成为一套支持 AIGC 创作的物理世界仿真模拟器。

19 0 2025-08-31

豆包1.5·UI-baidu09TARS – 字节豆包推出的 GUI Agent 模型

豆包1.5·UI-TARS是字节豆包推出的面向图形界面交互（GUI）的Agent模型。模型基于感知、推理和动作执行等类人能力，与图形界面进行连续、流畅的交互。模型将视觉理解、逻辑推理、界面元素定位和操作整合在单一模型中，无需预定义工作流程或人工规则，实现端到端的任务自动化。

16 0 2025-08-31

谛韵DiffRhythm – 西北工业联合港中文推出的端到端音乐生成工具

DiffRhythm（中文名称：谛韵）是西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型（Latent Diffusion）技术，能快速生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示，DiffRhythm 能在10秒内生成长达4分45秒的高质量音乐作品。

18 0 2025-08-31

讯飞星火X1 – 科大讯飞推出的首个全国产深度推理大模型

讯飞星火X1是科大讯飞于2025年1月15日发布的国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。在解题过程中更接近人类的“慢思考”方式，仅用更少的算力就实现了业界一流的效果，多项指标国内第一。

18 0 2025-08-31

蓝心大模型 – vivo推出的全新自研通用大模型矩阵，30亿端侧大模型

蓝心大模型是vivo发布的全新自研通用大模型矩阵，包括语言大模型、端侧大模型、语音大模型、图像大模型以及多模态大模型。在多个领域和场景中发挥着重要作用，例如内容创作辅助、知识问答系统、逻辑推理与分析、代码生成和软件开发、信息提取和数据分析、自动化办公、多语言翻译和本地化以及创意娱乐等。

23 0 2025-08-31

腾讯混元Turbo S – 腾讯推出的新一代快思考模型

腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融合架构，有效降低了传统Transformer的计算复杂度，减少了KV-Cache缓存占用，显著提升了训练和推理效率。

24 0 2025-08-31

腾讯混元T1 – 腾讯混元推出的最新深度思考模型

T1（Thinker）是腾讯混元推出的最新深度思考模型，已正式上线接入腾讯元宝。模型专注于逻辑推理和深度思考，支持联网搜索功能，能从互联网信源、微信公众号、视频号等腾讯生态内容中获取信息，确保回答的时新性和权威性。

25 0 2025-08-31

联通元景 – 中国联通AI开源的中文原生文生图模型

联通元景（UniT2IXL）是中国联通AI推出的中文原生文生图模型，完全在国产昇腾AI基础软硬件平台上实现训练和推理。模型采用复合语言编码模块，优化中文长文本和特色词汇理解，提升图像生成质量。

21 0 2025-08-31

美图奇想大模型 – 美图公司推出的AI视觉大模型

美图奇想大模型（MiracleVision）是美图公司推出的一款AI视觉大模型，专注于美学创作，包括东方美学、人像和商业设计等。模型完成了视频生成能力的全面升级，能生成1分钟、每秒24帧、1080P分辨率的高质量视频，显著提升视频的画质、流畅性和真实性。

23 0 2025-08-31

福棠·百川 – 百川智能联合北京儿童等推出的儿科大模型

福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见病及疑难病症的立体化知识体系，具备强大的儿科临床推理能力，首创儿科“循证模式”，能像专业儿科医生一样整合最佳医学证据，为患儿制定科学、个性化的诊疗方案。

25 0 2025-08-31

盘古大模型 5.5 – 华为推出的新一代AI大模型

盘古大模型5.5是华为在开发者大会（HDC 2025）上发布的最新一代人工智能大模型。模型强调“不作诗，只做事”，专注于解决实际产业问题，推动千行百业的智能化升级。

22 0 2025-08-31

百聆 – AI语音对话助手，端到端时延低至800ms

百聆(Bailing)是开源的语音对话助手，基于语音识别（ASR）、语音活动检测（VAD）、大语言模型（LLM）和语音合成（TTS）技术实现与用户的自然语音对话，实现类GPT-4o的对话效果。百聆无需GPU即可运行，端到端时延低至800ms，适用于各种边缘设备和低资源环境。

24 0 2025-08-31

百度智能云一见 – 百度推出的AI视觉大模型平台

百度智能云一见是百度智能云推出的视觉大模型平台，旨在基于领先的视觉大模型技术和丰富的场景化算法方案，实现专业级视觉AI应用的平民化。平台打通从模型生产、效果优化到应用配置的全链路闭环，帮助企业和行业伙伴低成本、零门槛地建设专业级视觉AI应用。

22 0 2025-08-31

瑞智病理大模型 – 瑞金联合华为推出的多模态互动式病理大模型

瑞智病理大模型（RuiPath）是上海交通大学医学院附属瑞金医院与华为共同推出的临床级国产多模态互动式病理大模型。模型覆盖了中国每年全癌种发病人数90%的常见癌种，包含垂体神经内分泌肿瘤等罕见病。

22 0 2025-08-31

‹‹ ‹ 1 2 3 4 5 6 7 8 9 10 › ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30