AI 第11页_拜读未来科技摆渡人生

cogvlm2-baidu09llama3-baidu09caption – 智普AI开源的视频标注模型，生成文本描述

cogvlm2-llama3-caption模型是一个基于CogVLM2架构的视频描述生成模型。模型用于理解视频内容，自动生成描述视频内容的文本标题或字幕。

18 0 2025-08-31

cobalt – 开源免费的图片、音频和视频下载工具

cobalt是开源免费的图片、音频和视频下载工具，提供纯净、简洁无广告的体验。cobalt支持全平台视频、音频和图片下载，包括主流视频网站、社交媒体和音乐平台。

18 0 2025-08-31

clone-baidu09voice – 开源的声音克隆工具，支持16种语言

Clone-voice是开源的声音克隆工具，基于深度学习技术分析和模拟人类声音，实现声音的高质量克隆。工具支持包括中文、英文、日语、韩语等在内的16种语言，能将文本转换为语音或将一种声音风格转换为另一种。用户界面友好，操作简单，不需要高性能的硬件支持，适合个人和专业领域使用。

21 0 2025-08-31

autoMate – AI本地自动化工具，自然语言实现自动化任务操作

autoMate是基于AI和RPA的本地自动化工具，用自然语言实现复杂任务的自动化操作。autoMate基于大型语言模型，用户无需编程知识，用自然语言描述任务，能完成计算机界面操作、复杂工作流执行及智能决策。

19 0 2025-08-31

auto-baidu09video-baidu09generator – AI自动解说视频生成器

auto-video-generator是AI自动解说视频生成器，能实现一键生成解说视频。用户只需输入主题，系统便自动撰写脚本、合成语音、生成图片并合成视频，极大提升内容创作效率。

16 0 2025-08-31

anime.gf – AI虚拟角色创建与互动的开源应用

Anime.gf 是一个开源的本地应用程序，支持用户创建和互动自己的虚拟角色。工具提供一个用户友好的界面，用户与各种具有独特个性和语言风格的虚拟角色进行交流。

20 0 2025-08-31

amis – 百度开源的低代码前端框架

amis 是百度开源的低代码前端框架，基于简单的 JSON 配置快速生成各种后台页面，无需编写复杂前端代码。amis支持表单、表格、图表、CRUD 操作等功能，提供丰富的开箱即用组件，具备高扩展性和灵活性，支持轻松集成到 React 或纯 HTML 项目中。

15 0 2025-08-31

aisuite – 吴恩达发布开源Python库，一个接口调用多个大模型

aisuite是开源的Python库，吴恩达（Andrew Ng）发布的，旨在提供一个统一的接口来调用多个大型语言模型（LLM）服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台，开发者能轻松切换和测试不同提供商的模型。

18 0 2025-08-31

ai-baidu09chatbot – 开源AI聊天机器人模板，快速构建高性能聊天应用

ai-chatbot是Vercel推出的开源项目，基于Next.js框架和Vercel AI SDK构建。ai-chatbot提供一个功能完备、易于定制的AI聊天机器人模板，帮助开发者快速构建高性能和良好用户体验的聊天应用。项目集成前沿技术，支持多种大语言模型，具备灵活的模型切换能力，提供出色的UI设计和数据管理功能。

19 0 2025-08-31

abogen – 开源AI文本转语音工具，支持生成同步字幕

abogen 是强大的文本转语音工具，支持将 ePub、PDF 或文本文件快速转换为高质量音频，能生成同步字幕。abogen 基于 Kokoro-82M 模型，支持多种语言和语音风格，用户能通过简单配置调整语速、选择语音、设置字幕样式等。

20 0 2025-08-31

abab-baidu09video-baidu091 – MiniMax推出的首款AI高清视频生成模型

abab-video-1是MiniMax公司推出的首款AI高清视频生成模型，模型支持生成最高1280x720分辨率、25fps的高清视频，具备电影感的镜头移动效果，能根据文本描述快速创造出具有视觉冲击力的内容。

17 0 2025-08-31

abab-baidu09music-baidu091 – MiniMax 推出端到端 AI 音乐生成大模型

abab-music-1 是 MiniMax 推出的一款端到端 AI 音乐生成大模型。支持多功能端到端音乐生成，能合成多种音乐形式，包括纯音乐和清唱作品，同时满足伴奏和人声的生成，简化了音乐录制与创作过程。

16 0 2025-08-31

Zonos – ZyphraAI 开源的多语言 TTS 模型

Zonos是Zyphra推出的高保真文本到语音（TTS）模型。Zonos包含两个模型：16亿参数的Transformer模型和SSM混合模型，均在Apache 2.0许可下开源。Zonos根据文本提示和说话人嵌入生成自然、高表达性的语音，支持语音克隆功能，可调节语速、音高、情感等参数，输出采样率为44kHz。

20 0 2025-08-31

Zion – 零代码AI应用开发平台

Zion是一个零代码AI应用开发平台，通过可视化配置和拖拽式交互，大幅降低了应用开发的技术门槛。用户无需编程知识即可快速构建小程序、网站等应用。Zion集成了人工智能技术，提供智能知识库、数据处理等功能，支持个性化定制和业务自动化，旨在提升开发效率和经营效能。

17 0 2025-08-31

Zerox – 开源的OCR工具，零样本识别多种格式文件

Zerox是开源的本地化高精度OCR工具，基于GPT-4o-mini模型，无需提前训练实现零样本识别。Zerox支持PDF、DOCX、图片等多种格式文件，擅长处理扫描版文档及复杂布局文件，如含表格、图表等。Zerox工作流程是将文件转换为图像后进行OCR识别，最终输出Markdown格式文档，方便用户编辑和使用。

16 0 2025-08-31

‹‹ ‹ 7 8 9 10 11 12 13 14 15 16 › ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30