neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

SWEET-baidu09RL – Meta 推出的多轮强化学习框架

SWEET-baidu09RL – Meta 推出的多轮强化学习框架

SWEET-RL是Meta推出的多轮强化学习框架,专门用在训练大型语言模型(LLM)代理进行协作推理任务。SWEET-R基于训练时的额外信息(如参考解决方案)优化“批评者”模型,模型为每个步骤提供奖励,帮助“行动者”模型更好地分配信用、优化策略。
17 0 2025-08-30
SWE-baidu09agent – 普林斯顿开源的AI程序员智能体

SWE-baidu09agent – 普林斯顿开源的AI程序员智能体

SWE-agent是一个由普林斯顿大学NLP组研究人员开发的开源AI程序员和软件工程师系统,利用大型语言模型(如GPT-4)的能力,可以自动解决GitHub存储库中的问题。SWE-agent通过智能体-计算机接口(ACI)与代码库交互,能够执行代码的浏览、编辑、测试和执行等任务。
18 0 2025-08-30
SWE-baidu09Lancer – OpenAI 推出的大模型基准测试

SWE-baidu09Lancer – OpenAI 推出的大模型基准测试

SWE-Lancer 是 OpenAI 推出的大模型基准测试,评估前沿语言模型(LLMs)在自由职业软件工程任务中的表现。包含来自 Upwork 的 1400 多个任务,总价值达 100 万美元,分为个人贡献者(IC)任务和管理任务。
14 0 2025-08-30
SWE-baidu09Kit – 构建自定义软件工程AI代理的开源框架

SWE-baidu09Kit – 构建自定义软件工程AI代理的开源框架

SWE-Kit 是Composio 推出的开源框架, 简化软件工程 AI 代理的开发过程。SWE-Kit提供无头 IDE 环境和 AI 原生工具,用于构建自定义编码代理,支持与多种代理框架和大型语言模型集成,降低构建复杂 AI 代理的门槛。SWE-Kit 集成文件操作、代码分析、shell 命令执行等功能,提高开发效率、提供高度的可定制性,是现代 AI 辅助软件开发的领先工具。
17 0 2025-08-30
SVFR – 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架

SVFR – 腾讯优图联合厦门大学推出的通用视频人脸修复统一框架

SVFR(Stable Video Face Restoration)是腾讯优图实验室和厦门大学联合推出的用于广义视频人脸修复的统一框架,整合了视频人脸修复(BFR)、着色和修复任务,基于Stable Video Diffusion(SVD)的生成和运动先验,通过统一的人脸修复框架整合特定于任务的信息。
20 0 2025-08-30
SVDQuant – MIT 推出的扩散模型后训练量化技术

SVDQuant – MIT 推出的扩散模型后训练量化技术

SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中的异常值,在保持图像质量的同时,实现在16GB 4090 GPU上3.5倍的显存优化和8.7倍的延迟减少。
15 0 2025-08-30
SUPIR – 高保真的AI图像修复和画质增强模型

SUPIR – 高保真的AI图像修复和画质增强模型

SUPIR是一个突破性的图像修复和画质增强方法,利用了大规模的生成模型StableDiffusion-XL(SDXL)和模型扩展技术,通过深度学习和多模态方法,实现了对低质量图像的高质量恢复。
16 0 2025-08-30
STranslate – 多功能免费AI翻译工具,支持离线OCR识别

STranslate – 多功能免费AI翻译工具,支持离线OCR识别

STranslate是专为Windows用户设计的多功能翻译和OCR工具。支持多种语言翻译,具备划词、截图、监听剪贴板等多种翻译方式,并提供多家翻译服务接口。还拥有基于PaddleOCR的离线OCR功能,支持中文、英文、日文和韩文识别。
18 0 2025-08-30
STIV – 苹果公司推出的视频生成大模型

STIV – 苹果公司推出的视频生成大模型

STIV(Scalable Text and Image Conditioned Video Generation)是苹果公司推出的视频生成大模型。STIV拥有8.7亿参数,能处理文本到视频(T2V)和文本图像到视频(TI2V)任务,基于联合图像-文本分类器自由引导(JIT-CFG)提升视频生成质量。
23 0 2025-08-30
START – 阿里联合中科大推出的自学推理模型

START – 阿里联合中科大推出的自学推理模型

START(Self-Taught Reasoner with Tools)是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型,结合外部工具(如Python代码执行器)提升大型语言模型(LLMs)的推理能力。START基于“Hint-infer”技术在推理过程中插入提示,激发模型使用外部工具,基于“Hint-RFT”框架进行自学习和微调。
23 0 2025-08-30
STAR – 南大、字节、西南大学联合开源的现实世界视频超分辨率框架

STAR – 南大、字节、西南大学联合开源的现实世界视频超分辨率框架

STAR是南京大学、字节跳动、西南大学联合推出的,创新的现实世界视频超分辨率(VSR)框架,能从低分辨率(LR)视频生成高分辨率(HR)视频,同时保持细节清晰度和时间一致性。STAR整合强大的文本到视频(T2V)扩散模型增强视频的空间细节和时间建模能力。STAR引入局部信息增强模块(LIEM),在全局注意力块之前丰富局部细节,减轻复杂退化引入的伪影问题。
18 0 2025-08-30
SPRIGHT – 专注于空间关系的大型视觉语言数据集

SPRIGHT – 专注于空间关系的大型视觉语言数据集

SPRIGHT(SPatially RIGHT)是亚利桑那州立大学 、Intel 实验室 、Hugging Face 、华盛顿大学等机构联合推出的,专注于空间关系的大型视觉-语言数据集,能解决现有文本到图像(T2I)模型在生成图像时空间一致性不足的问题。
20 0 2025-08-30
SPDL – Meta AI 推出的开源高性能AI模型数据加载解决方案

SPDL – Meta AI 推出的开源高性能AI模型数据加载解决方案

SPDL(Scalable and Performant Data Loading)是 Meta AI 推出的开源数据加载工具,能提高 AI 模型训练效率。基于多线程技术,实现高吞吐量数据加载,减少计算资源消耗。与传统基于进程的方法相比,SPDL 提升2-3倍的吞吐量,与 Free-Threaded Python 兼容,能在禁用 GIL 的环境中进一步提升30%的性能。
21 0 2025-08-30