neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

VideoVAE+ – 香港科技大学推出的先进跨模态视频变分自编码器

VideoVAE+ – 香港科技大学推出的先进跨模态视频变分自编码器

VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE),通过引入新的时空分离压缩机制和文本指导,实现了对大幅运动视频的高效压缩与精准重建,同时保持了良好的时间一致性和运动恢复。
16 0 2025-08-31
GameGen-baidu09X – 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法

GameGen-baidu09X – 香港科技大学联合多所机构推出的交互式开放世界游戏生成算法

GameGen-X是香港科技大学、中国科学技术大学等机构研究人员推出的扩散变换器模型,用在生成和交互控制开放世界游戏视频。模型能模拟游戏引擎功能,如创新角色、动态环境、复杂动作和多样化事件,支持用户用文本指令和键盘控制等多模态信号影响游戏内容,实现游戏玩法的模拟。
19 0 2025-08-29