neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

Proxy Lite – 开源视觉语言模型,支持自动化网页任务

Proxy Lite – 开源视觉语言模型,支持自动化网页任务

Proxy Lite 是开源的轻量级视觉语言模型(VLM),参数量为3B,支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器,完成网页交互、数据抓取、表单填写等重复性工作,显著降低自动化成本。Proxy Lite用“观察-思考-工具调用”的三步决策机制,具备强大的泛化能力和低资源占用,支持在消费级GPU上高效运行。
18 0 2025-08-30
Open-baidu09Sora – 开源的类Sora架构的视频生成模型和复现方案

Open-baidu09Sora – 开源的类Sora架构的视频生成模型和复现方案

Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open-Sora同样基于DiT架构,通过三个阶段训练:大规模图像预训练、大规模视频预训练和高质量视频数据微调,以生成与文本描述相符的视频内容。
19 0 2025-08-30
DispatchMail – 开源AI邮件助手,自动化管理邮箱

DispatchMail – 开源AI邮件助手,自动化管理邮箱

DispatchMail 是开源的、本地运行的 AI 邮件助手,支持通过AI技术自动化收件箱管理。工具能实时监控邮件,用 OpenAI 的 AI Agent根据用户自定义的提示词对邮件进行智能处理和分析。
20 0 2025-08-28