neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

阿里通义视频生成大模型即将上线,预约通道已开启

阿里通义视频生成大模型即将上线,预约通道已开启

阿里巴巴旗下的通义实验室即将推出重磅新品——视频生成大模型!这个消息对于广大AI爱好者和内容创作者来说无疑是个好消息。目前,通义App频道和通义万相PC端已经上线了“视频生成”的预约入口,这意味着大家很快就能体验
4 0 2025-09-08
ZeroSearch – 阿里通义开源的大模型搜索引擎框架

ZeroSearch – 阿里通义开源的大模型搜索引擎框架

ZeroSearch 是阿里巴巴通义实验室开源的创新大模型搜索引擎框架,基于强化学习激励大模型的搜索能力,无需与真实搜索引擎交互。框架爱基于大模型预训练知识,转化为检索模块,根据查询生成相关或噪声文档,动态控制生成质量。
21 0 2025-08-31
OmniSearch – 阿里通义推出的多模态检索增强生成框架

OmniSearch – 阿里通义推出的多模态检索增强生成框架

OmniSearch是阿里巴巴通义实验室推出的多模态检索增强生成框架,具备自适应规划能力。OmniSearch能动态拆解复杂问题,根据检索结果和问题情境调整检索策略,模拟人类解决复杂问题的行为,提升检索效率和准确性。OmniSearch引入动态检索规划框架,基于递归检索与推理流程,逐步接近问题解答,显著提高多模态检索的灵活性和效果。
12 0 2025-08-30
OmniAudio – 阿里通义推出的空间音频生成模型

OmniAudio – 阿里通义推出的空间音频生成模型

OmniAudio 是阿里巴巴通义实验室语音团队推出的从360°视频生成空间音频(FOA)的技术。为虚拟现实和沉浸式娱乐提供更真实的音频体验。通过构建大规模数据集Sphere360,包含超过10.3万个视频片段,涵盖288种音频事件,总时长288小时,为模型训练提供了丰富资源。
18 0 2025-08-30
MaskSearch – 阿里通义推出的检索增强预训练框架

MaskSearch – 阿里通义推出的检索增强预训练框架

MaskSearch是阿里巴巴通义实验室推出的新型通用预训练框架,提升大型语言模型(LLM)的智能体搜索能力。通过检索增强掩码预测(RAMP)任务,让模型在输入文本中对关键信息掩码。
18 0 2025-08-30
HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型

HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型

HumanOmni 是专注于人类中心场景的多模态大模型,视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入,能全面理解人类行为、情感和交互。模型基于超过240万视频片段和1400万条指令进行预训练,采用动态权重调整机制,根据不同场景灵活融合视觉和听觉信息。
20 0 2025-08-29
AnyStory – 阿里通义推出的高保真个性化文本到图像生成框架

AnyStory – 阿里通义推出的高保真个性化文本到图像生成框架

AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架,实现单个和多个主体的高保真个性化图像生成。通过“编码-路由”的方法来建模主体个性化问题。在编码阶段,AnyStory结合强大的ReferenceNet和CLIP视觉编码器,对主体特征进行高保真度的编码,捕捉丰富的细节和语义信息。
21 0 2025-08-28
Manus与阿里通义达成合作

Manus与阿里通义达成合作

据媒体报道,火爆异常的AI Agent新秀Manus和阿里云旗下大语言模型通义千问达成合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能;双方将共同推动通用智能体技术的普惠化与商业化落地。 有业界分析人士认为2025或是Agent元年,Manus和阿里的合作标志着国产大模型与智能体技术的深度融合,而且还可能为资本市场带来新一轮投资机遇。比如Manus的迅速出圈后为其商业化合作和融资都创造了很好的条件。 由BUTTERFLY EFFEC
24 0 2025-08-27