neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

阿里通义开源首个CoT音频模型,音·画同步被狠狠拿捏了

阿里通义开源首个CoT音频模型,音·画同步被狠狠拿捏了

阿里通义开源首个CoT音频模型,音·画同步被狠狠拿捏了

AI音效已经进化成这样了吗??


打开声音🦻,来快速感受一下最新feel:


模拟婴儿哭声,那叫一个高低起伏、荡气回肠,整个节奏和婴儿表情姿态神同步了。


阿里通义开源首个CoT音频模型,音·画同步被狠狠拿捏了

17 0 2025-09-05
Wan2.1 – 阿里开源的AI视频生成大模型

Wan2.1 – 阿里开源的AI视频生成大模型

Wan2.1是阿里云开源的AI视频生成大模型,具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务,包含两种尺寸的模型,14B参数的专业版擅长复杂运动生成和物理建模,性能卓越;1.3B参数的极速版能在消费级显卡上运行,显存需求低,适合二次开发和学术研究。
21 0 2025-08-31
Qwen2 – 阿里云开源的新一代通义千问大模型

Qwen2 – 阿里云开源的新一代通义千问大模型

Qwen2是由阿里云通义千问团队开源的新一代大语言模型,该系列涵盖了从0.5B到72B不等的五个规模模型,在中文和英文基础上增加了27种语言的高质量数据,大幅提升了模型的自然语言理解、代码编写、数学解题和多语言处理能力。
22 0 2025-08-30
MNN – 阿里开源的移动端深度学习推理框架

MNN – 阿里开源的移动端深度学习推理框架

MNN(Mobile Neural Network)是阿里巴巴集团开源的轻量级深度学习推理框架,为移动端、服务器、个人电脑、嵌入式设备等多种设备提供高效的模型部署能力。MNN支持TensorFlow、Caffe、ONNX等主流模型格式,兼容CNN、RNN、GAN等多种网络结构。
21 0 2025-08-29
DreaMoving – 阿里开源的基于扩散模型的人类视频生成框架

DreaMoving – 阿里开源的基于扩散模型的人类视频生成框架

DreaMoving是一个基于扩散模型的人类视频生成框架,由阿里巴巴集团的研究团队开发。DreaMoving通过视频控制网络和内容引导器实现对人物动作和外观的精确控制,使得用户可以通过简单的文本描述或图像提示来生成个性化的视频内容。
21 0 2025-08-28
AgentScope – 阿里开源的多智能体开发平台

AgentScope – 阿里开源的多智能体开发平台

AgentScope是阿里巴巴集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高易用性、高鲁棒性和分布式支持,内置多种模型API和本地模型部署选项,覆盖聊天、图像合成、文本嵌入等多种任务。
21 0 2025-08-27