北大联合大学_拜读未来科技摆渡人生

HoloTime – 北大联合鹏城实验室推出的全景4D场景生成框架

HoloTime 是北京大学深圳研究生院和鹏城实验室推出的全景 4D 场景生成框架，基于视频扩散模型将单张全景图像转化为具有真实动态效果的全景视频，进一步重建为沉浸式的 4D 场景。

19 0 2025-08-29

Dive3D – 北大联合小红书推出的文本到3D生成框架

Dive3D是北京大学和小红书公司合作推出的文本到3D生成框架。框架基于分数的匹配（Score Implicit Matching，SIM）损失替代传统的KL散度目标，有效避免模式坍塌问题，显著提升3D生成内容的多样性。

18 0 2025-08-28

DiffSplat – 北大联合字节推出的 3D 生成框架

DiffSplat是新型的 3D 生成方法，从文本提示和单视图图像快速生成 3D 高斯点阵（Gaussian Splats）。通过微调预训练的文本到图像扩散模型，基于强大的 2D 先验知识，引入 3D 渲染损失来确保生成的 3D 内容在多视图下保持一致性。

22 0 2025-08-28

DiffEditor – 北大联合腾讯推出的细粒度图像编辑工具

DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型（Diffusion Model）的图像编辑工具，通过引入图像提示（image prompts）和文本提示，结合区域随机微分方程（Regional SDE）和时间旅行策略，显著提升了图像编辑的准确性和灵活性。

21 0 2025-08-28

ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型

ConsisID是北京大学和鹏城实验室等机构推出的文本到视频（Text-to-Video, IPT2V）生成模型，基于频率分解技术保持视频中人物身份的一致性。模型用免调优（tuning-free）的Diffusion Transformer（DiT）架构，结合低频全局特征和高频内在特征，用分层训练策略生成高质量、可编辑且身份一致性强的视频。

22 0 2025-08-28

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30