neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

TheoremExplainAgent – AI教学双智能体,数理化定理自动转动画

TheoremExplainAgent – AI教学双智能体,数理化定理自动转动画

TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理系统,基于生成长篇动画视频帮助人们更好地理解数学和科学定理。TheoremExplainAgent支持生成超过5分钟的教育视频,覆盖多个STEM领域(如数学、物理、化学和计算机科学)。
16 0 2025-08-31
The Matrix – 阿里联合港大等多所机构推出的AI基础世界模拟器

The Matrix – 阿里联合港大等多所机构推出的AI基础世界模拟器

The Matrix是与电影同名的、首个AI基础世界模拟器,是全华人团队推出的(作者分别来自阿里巴巴、香港大学、滑铁卢大学和加拿大AI研究机构Vector Insititute)。The Matrix能生成无限长、高保真720p真实场景视频流,支持实时交互控制。
17 0 2025-08-31
TextHarmony – 字节联合华东师范推出的多模态生成模型

TextHarmony – 字节联合华东师范推出的多模态生成模型

TextHarmony是华东师范大学和字节跳动共同推出的多模态生成模型,擅长理解和生成视觉文本。模型基于Slide-LoRA技术,动态聚合特定于模态和模态无关的LoRA专家,部分解耦多模态生成空间,在单一模型实例中协调视觉和语言的生成。
18 0 2025-08-31
TextDiffuser-baidu092 – 微软等推出的AI图像文本渲染融合框架

TextDiffuser-baidu092 – 微软等推出的AI图像文本渲染融合框架

Text-Diffuser 2是由来自微软研究院、香港科技大学和中山大学的研究人员最新推出的一个基于扩散模型的文本渲染方法,旨在解决图像扩散模型生成文字时在灵活性、自动化、布局预测能力和风格多样性方面的局限性,以提高生成图像中视觉文本的质量和多样性。
19 0 2025-08-31
Text to Bark – ElevenLabs 推出的 AI“狗语”文本转语音模型

Text to Bark – ElevenLabs 推出的 AI“狗语”文本转语音模型

Text to Bark 是 ElevenLabs 推出的全球首个AI“狗语”文本转语音模型。用户输入文字选择犬种,模型能生成高度逼真的狗吠声,95%的狗无法分辨其与真实吠声。模型基于开源犬类语言学研究开发,支持个性化选择品种和调整语气,能部署到智能家居设备等“云吠基础设施”。
15 0 2025-08-31
Text Behind Image – 开源在线图像处理工具,在图中角色背后添加文字

Text Behind Image – 开源在线图像处理工具,在图中角色背后添加文字

Text Behind Image是开源的在线工具,支持用户在图片中的角色背后添加文字,创建具有视觉冲击力的海报和社交媒体图像。用户在图像中的主体背后添加自定义文本,并提供文字、字体、颜色、位置、粗细、不透明度、旋转和重复等多种自定义选项。工具是16岁的开发者Rexan Wong推出的,代码完全公开在 GitHub 上。
16 0 2025-08-31
TesserAct – AI 4D具身世界模型,能预测3D场景的动态演变

TesserAct – AI 4D具身世界模型,能预测3D场景的动态演变

TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGB-DN(RGB、深度和法线)视频数据来学习,超越了传统的 2D 模型,能将详细的形状、配置和时间变化纳入预测中。
17 0 2025-08-31
TeleChat2-baidu09115B – 中国电信AI研究院推出的开源星辰语义大模型

TeleChat2-baidu09115B – 中国电信AI研究院推出的开源星辰语义大模型

TeleChat2-115B是由中国电信人工智能研究院(TeleAI)研发的大型语言模型,属于星辰语义大模型系列。基于国产算力进行训练,采用10万亿Tokens的中英文高质量语料。与前代模型相比,TeleChat2-115B在通用问答、知识类、代码类和数学类任务上的性能显著提升。
14 0 2025-08-31
TeleAI 视频生成大模型 – 中国电信AI研究院推出的视频生成模型

TeleAI 视频生成大模型 – 中国电信AI研究院推出的视频生成模型

TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型,基于两阶段生成框架:先根据文本描述创建分镜头草图,再基于草图生成视频。TeleAI 视频生成大模型能确保视频中主体外观的一致性,精确控制动作和外观,实现复杂场景和动作的流畅过渡,遵循物理规律和常识。
15 0 2025-08-31
Teacher2Task – 谷歌推出的多教师学习框架

Teacher2Task – 谷歌推出的多教师学习框架

Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N+1个任务,包括N个辅助任务预测每位教师的标记风格,及一个主要任务关注真实标签。
15 0 2025-08-31