mPLUG-baidu09Owl3 – 阿里巴巴推出的通用多模态AI模型 mPLUG-Owl3是阿里巴巴推出的先进通用多模态大模型,专为理解和处理多图及长视频设计。在保持准确性的同时,显著提升了推理效率,能在4秒内分析完2小时电影。 18 0 2025-08-31
FLUX-baidu09Text – 阿里推出的多语言场景文本编辑框架 FLUX-Text 是阿里推出的新型的多语言场景文本编辑框架,基于扩散模型(Diffusion Model)和轻量级字形嵌入模块。框架基于注入字形条件信息,提升复杂场景下文本生成的准确性和保真度,在处理非拉丁字符(如中文)时表现出色。 20 0 2025-08-28