neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

VideoVAE+ – 香港科技大学推出的先进跨模态视频变分自编码器

VideoVAE+ – 香港科技大学推出的先进跨模态视频变分自编码器

VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE),通过引入新的时空分离压缩机制和文本指导,实现了对大幅运动视频的高效压缩与精准重建,同时保持了良好的时间一致性和运动恢复。
16 0 2025-08-31
Motion Dreamer – 香港科技大学推出的运动合理视频生成框架

Motion Dreamer – 香港科技大学推出的运动合理视频生成框架

Motion Dreamer是香港科技大学(广州)研究者提出的视频生成框架,生成运动合理视频。基于两阶段生成方式,先基于输入图像和运动条件生成中间运动表示,再利用该表示生成高细节视频。其引入实例流这一新运动模态,可实现从稀疏到密集的运动控制,用户通过提供稀疏运动提示,模型能生成时间连贯视频。
13 0 2025-08-30