neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Qwen2vl-baidu09Flux – 开源的多模态图像生成模型,支持多种生成模式

Qwen2vl-baidu09Flux – 开源的多模态图像生成模型,支持多种生成模式

Qwen2VL-Flux是多模态图像生成模型,结合Qwen2VL的视觉语言理解和FLUX框架,基于文本提示和图像参考生成高质量的图像。模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及ControlNet引导生成,具备深度估计和线条检测功能,实现更精确的图像控制。
17 0 2025-08-30
MagicPose – AI视频生成模型,能生成逼真的人体动作和面部表情

MagicPose – AI视频生成模型,能生成逼真的人体动作和面部表情

MagicPose是南加州大学和字节跳动联合研发的AI视频生成模型,无需任何微调,直接生成逼真的人类动作和面部表情视频。MagicPose通过一个新颖的两阶段训练策略,分离人体动作和外观特征,实现了在不同身份间进行动作和表情的精确转移。
17 0 2025-08-29