neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

D-baidu09DiT – 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

D-baidu09DiT – 耶鲁大学联合字节Seed等机构推出的多模态扩散模型

D-DiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。模型结合连续图像扩散(流匹配)和离散文本扩散(掩码扩散),基于双向注意力机制同时训练图像和文本模态。
23 0 2025-08-28