neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

DiffSplat – 北大联合字节推出的 3D 生成框架

DiffSplat – 北大联合字节推出的 3D 生成框架

DiffSplat是新型的 3D 生成方法,从文本提示和单视图图像快速生成 3D 高斯点阵(Gaussian Splats)。通过微调预训练的文本到图像扩散模型,基于强大的 2D 先验知识,引入 3D 渲染损失来确保生成的 3D 内容在多视图下保持一致性。
22 0 2025-08-28
ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型

ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型

ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率分解技术保持视频中人物身份的一致性。模型用免调优(tuning-free)的Diffusion Transformer(DiT)架构,结合低频全局特征和高频内在特征,用分层训练策略生成高质量、可编辑且身份一致性强的视频。
22 0 2025-08-28