neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

VITA – 腾讯推出的开源多模态AI模型

VITA – 腾讯推出的开源多模态AI模型

VITA是腾讯优图实验室推出的全球首个开源多模态大语言模型(MLLM),能理解和处理视频、图像、文本和音频。基于Mixtral 8×7B模型,扩展了中文词汇量,进行了双语指令微调,支持自然人机交互,无需唤醒词即可响应。
20 0 2025-08-31
FlexIP – 腾讯推出的个性化图像生成编辑框架

FlexIP – 腾讯推出的个性化图像生成编辑框架

FlexIP 是腾讯提出的面向图像合成的灵活主体属性编辑框架,平衡图像生成中的身份保持和个性化编辑。框架采用双适配器架构,将身份保持与个性化编辑解耦,通过高层语义概念与低层空间细节确保身份完整性。
22 0 2025-08-29
BrushNet – 腾讯推出的高质量图像照片修复模型

BrushNet – 腾讯推出的高质量图像照片修复模型

BrushNet是由腾讯PCG部门的ARC实验室与香港大学的研究人员推出的一个基于扩散模型的即插即用的图像照片修复(Inpainting)模型,通过分解的双分支架构来有效处理图像中的遮罩区域,可保持原有图像内容连贯性的同时,生成高质量的修复结果。
23 0 2025-08-28