neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

XVerse – 字节跳动推出的多主体控制图像生成模型

XVerse – 字节跳动推出的多主体控制图像生成模型

XVerse是字节跳动智能创作团队推出的新型多主体控制图像生成模型。模型在文本到图像生成领域实现对多个主体身份和语义属性(如姿势、风格、光照)的精细控制,同时保持生成图像的高质量和一致性。
20 0 2025-08-31
VeOmni – 字节跳动开源的全模态PyTorch原生训练框架

VeOmni – 字节跳动开源的全模态PyTorch原生训练框架

VeOmni 是字节跳动 Seed 团队开源的全模态分布式训练框架,基于 PyTorch 设计。VeOmni 以模型为中心,将分布式并行逻辑与模型计算解耦,支持灵活组合多种并行策略(如 FSDP、SP、EP),能高效扩展至超长序列和大规模 MoE 模型。
23 0 2025-08-31
Valley – 字节跳动推出的多模态大模型

Valley – 字节跳动推出的多模态大模型

Valley是字节跳动推出的多模态大模型,用于处理涉及文本、图像和视频数据的多样化任务。Valley在内部电子商务和短视频基准测试中取得了最佳成绩,并在OpenCompass测试中展现出色性能,尤其是在小于10B参数规模的模型中排名第二。
22 0 2025-08-31
Sa2VA – 字节跳动等机构开源的多模态大语言模型

Sa2VA – 字节跳动等机构开源的多模态大语言模型

Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学共同推出的多模态大语言模型,是SAM2和LLaVA结合而成,能实现对图像和视频的密集、细粒度理解。Sa2VA基于统一的任务表示,将图像或视频指代分割、视觉对话、视觉提示理解等任务整合到一个框架中,用LLM生成的空间-时间提示指导SAM2生成精确分割掩码。
17 0 2025-08-30
FlowGram – 字节跳动开源的可视化工作流搭建引擎

FlowGram – 字节跳动开源的可视化工作流搭建引擎

FlowGram是字节跳动开源的基于节点编辑的可视化工作流搭建引擎,帮助开发者快速构建固定布局或自由连线布局的工作流。支持两种布局模式:固定布局适合顺序工作流和决策树,提供层次化结构和灵活的分支、复合节点;自由布局支持节点自由定位和手动连线,适合网络图和思维导图,支持对齐、自动布局等功能。
20 0 2025-08-29