neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

X-baidu09Dancer – 字节等机构推出音乐驱动的人像舞蹈视频生成框架

X-baidu09Dancer – 字节等机构推出音乐驱动的人像舞蹈视频生成框架

X-Dancer 是字节跳动联合加州大学圣地亚哥分校和南加州大学的研究人员共同推出的音乐驱动的人像舞蹈视频生成框架,支持从单张静态图像生成多样化且逼真的全身舞蹈视频。X-Dancer结合自回归变换器(Transformer)和扩散模型,用 2D 人体姿态建模,基于广泛可用的单目视频数据捕捉舞蹈动作与音乐节奏的复杂对齐关系。
20 0 2025-08-31
MARS – 字节推出优化大模型训练效率的框架

MARS – 字节推出优化大模型训练效率的框架

MARS(Make vAriance Reduction Shine)是字节跳动推出的创新的优化框架,提升大型模型训练的效率。MARS融合预条件梯度方法与方差减少技术,基于缩放随机递归动量技术优化梯度估计。MARS框架灵活,支持全矩阵或对角Hessian近似,衍生出基于AdamW、Lion和Shampoo的三种优化算法实例。
23 0 2025-08-29
DanceGRPO – 字节Seed联合港大推出的统一视觉生成强化学习框架

DanceGRPO – 字节Seed联合港大推出的统一视觉生成强化学习框架

DanceGRPO 是字节跳动 Seed 和香港大学联合推出的首个统一视觉生成强化学习框架。将强化学习应用在视觉生成领域,覆盖两大生成范式(diffusion 和 rectified flow)、三项任务(文本到图像、文本到视频、图像到视频)、四种基础模型(SD、HunyuanVideo、FLUX、SkyReels-I2V)及五类奖励模型(图像视频美学、图文对齐、视频动态质量、二元奖励)。
23 0 2025-08-28