neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Skywork UniPic – 昆仑万维开源的多模态统一预训练模型

Skywork UniPic – 昆仑万维开源的多模态统一预训练模型

Skywork UniPic 是昆仑万维开源的多模态统一预训练模型,具备图像理解、文本生成图像及图像编辑三大核心能力。模型基于自回归范式,融合 MAR 编码器和 SigLIP2 主干,构建轻量级架构,用 1.5B 参数规模实现高性能,逼近大模型效果。
23 0 2025-08-30
Skywork UniPic 2.0 – 昆仑万维开源的统一多模态模型

Skywork UniPic 2.0 – 昆仑万维开源的统一多模态模型

Skywork UniPic 2.0 是昆仑万维开源的高效多模态模型,专注于统一的图像生成、编辑和理解能力。模型基于2B参数的SD3.5-Medium架构,通过预训练、渐进式双任务强化策略和联合训练,实现生成与编辑任务的协同优化,性能超越多个大参数模型。
16 0 2025-08-30
Skywork R1V – 昆仑万维开源的多模态思维链推理模型

Skywork R1V – 昆仑万维开源的多模态思维链推理模型

Skywork R1V是昆仑万维开源的首款工业界多模态思维链推理模型,具备强大的视觉链式推理能力。Skywork R1V能对视觉输入进行多步逻辑推理,解决复杂的视觉任务,例如视觉逻辑推理、视觉数学问题、科学现象分析及医学影像诊断等。
21 0 2025-08-30
Skywork MindLink – 昆仑万维开源的推理大模型

Skywork MindLink – 昆仑万维开源的推理大模型

Skywork MindLink是昆仑万维推出开源的推理大模型。具有自适应推理机制,可根据任务复杂度灵活切换推理模式,简单任务快速生成,复杂任务深度推理,兼顾效率与准确性。计划驱动推理范式去掉了“think”标签,降低了推理成本,提升了多轮对话能力。
19 0 2025-08-30
SkyReels-baidu09A3 – 昆仑万维推出的数字人视频生成模型

SkyReels-baidu09A3 – 昆仑万维推出的数字人视频生成模型

SkyReels-A3是昆仑万维推出的先进AI模型,基于DiT(Diffusion Transformer)视频扩散架构,结合插帧、强化学习和运镜控制技术。模型能通过音频驱动,将照片或视频中的人物“激活”,使其开口说话或表演。
20 0 2025-08-30
SkyReels-baidu09A1 – 昆仑万维开源的表情动作可控算法

SkyReels-baidu09A1 – 昆仑万维开源的表情动作可控算法

SkyReels-A1是昆仑万维开源的中国首个SOTA(State-of-the-Art)级别的基于视频基座模型的表情动作可控算法。SkyReels-A1能实现更精准可控的人物视频生成,能基于任意人体比例(如肖像、半身及全身)生成高度逼真的动态视频。
17 0 2025-08-30
Sketch2Sound – Adobe 联合西北大学推出的AI音频生成技术

Sketch2Sound – Adobe 联合西北大学推出的AI音频生成技术

Sketch2Sound是Adobe 研究院和西北大学推出的AI音频生成技术,能基于声音模仿和文本提示生成高品质音效。Sketch2Sound从声音模仿中提取响度、亮度和音高三个控制信号,将控制信号编码后用于条件文本到声音的生成系统。
15 0 2025-08-30