Video-T1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(Test-Time Scaling,TTS)提升视频生成的质量和一致性。传统视频生成模型在训练后直接生成视频,Video-T1 在测试阶段引入额外计算资源,基于动态调整生成路径优化视频质量。
25
0
2025-08-31
LLaMA-Mesh是清华大学和NVIDIA共同推出的项目,基于将3D网格生成与大型语言模型(LLMs)结合,实现用文本提示直接生成3D模型的功能。项目用OBJ文件格式将3D网格的顶点坐标和面定义转换为文本,基于顶点量化技术优化处理,让模型能理解和生成3D网格。
22
0
2025-08-29
近日,清华大学人工智能产业研究院(AIR)和北京水木分子生物科技有限公司(简称:水木分子)携手推出了升级版的生物医药多模态开源基础大模型BioMedGPT-R1。此前,在2023年,双方合作发布了开源可商用、生物医药多模态百亿参数开源基础大模型BioMedGPT,水木分子发布了自研千亿参数多模态生物医药专业大模
27
0
2025-08-28
CLaMP 3是清华大学人工智能学院的朱文武教授团队推出的多模态、多语言的音乐信息检索框架。基于对比学习,将乐谱(如ABC符号)、音频(如MERT特征)和表演信号(如MIDI文本格式)与多种语言的文本描述对齐到一个共享的表示空间中。
23
0
2025-08-28
Absolute Zero是清华大学 LeapLab 团队联合北京通用人工智能研究院 NLCo 实验室和宾夕法尼亚州立大学推出的全新语言模型推理训练方法。Absolute Zero基于模型自我提出任务自主解决,实现自我进化式学习,无需依赖人类标注数据或预定义任务。
22
0
2025-08-27