cogvlm2-llama3-caption模型是一个基于CogVLM2架构的视频描述生成模型。模型用于理解视频内容,自动生成描述视频内容的文本标题或字幕。
18
0
2025-08-31
cobalt是开源免费的图片、音频和视频下载工具,提供纯净、简洁无广告的体验。cobalt支持全平台视频、音频和图片下载,包括主流视频网站、社交媒体和音乐平台。
18
0
2025-08-31
Clone-voice是开源的声音克隆工具,基于深度学习技术分析和模拟人类声音,实现声音的高质量克隆。工具支持包括中文、英文、日语、韩语等在内的16种语言,能将文本转换为语音或将一种声音风格转换为另一种。用户界面友好,操作简单,不需要高性能的硬件支持,适合个人和专业领域使用。
21
0
2025-08-31
autoMate是基于AI和RPA的本地自动化工具,用自然语言实现复杂任务的自动化操作。autoMate基于大型语言模型,用户无需编程知识,用自然语言描述任务,能完成计算机界面操作、复杂工作流执行及智能决策。
19
0
2025-08-31
auto-video-generator是AI自动解说视频生成器,能实现一键生成解说视频。用户只需输入主题,系统便自动撰写脚本、合成语音、生成图片并合成视频,极大提升内容创作效率。
16
0
2025-08-31
Anime.gf 是一个开源的本地应用程序,支持用户创建和互动自己的虚拟角色。工具提供一个用户友好的界面,用户与各种具有独特个性和语言风格的虚拟角色进行交流。
20
0
2025-08-31
amis 是百度开源的低代码前端框架,基于简单的 JSON 配置快速生成各种后台页面,无需编写复杂前端代码。amis支持表单、表格、图表、CRUD 操作等功能,提供丰富的开箱即用组件,具备高扩展性和灵活性,支持轻松集成到 React 或纯 HTML 项目中。
15
0
2025-08-31
aisuite是开源的Python库,吴恩达(Andrew Ng)发布的,旨在提供一个统一的接口来调用多个大型语言模型(LLM)服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台,开发者能轻松切换和测试不同提供商的模型。
18
0
2025-08-31
ai-chatbot是Vercel推出的开源项目,基于Next.js框架和Vercel AI SDK构建。ai-chatbot提供一个功能完备、易于定制的AI聊天机器人模板,帮助开发者快速构建高性能和良好用户体验的聊天应用。项目集成前沿技术,支持多种大语言模型,具备灵活的模型切换能力,提供出色的UI设计和数据管理功能。
19
0
2025-08-31
abogen 是强大的文本转语音工具,支持将 ePub、PDF 或文本文件快速转换为高质量音频,能生成同步字幕。abogen 基于 Kokoro-82M 模型,支持多种语言和语音风格,用户能通过简单配置调整语速、选择语音、设置字幕样式等。
20
0
2025-08-31
abab-video-1是MiniMax公司推出的首款AI高清视频生成模型,模型支持生成最高1280x720分辨率、25fps的高清视频,具备电影感的镜头移动效果,能根据文本描述快速创造出具有视觉冲击力的内容。
17
0
2025-08-31
abab-music-1 是 MiniMax 推出的一款端到端 AI 音乐生成大模型。支持多功能端到端音乐生成,能合成多种音乐形式,包括纯音乐和清唱作品,同时满足伴奏和人声的生成,简化了音乐录制与创作过程。
16
0
2025-08-31
Zonos是Zyphra推出的高保真文本到语音(TTS)模型。Zonos包含两个模型:16亿参数的Transformer模型和SSM混合模型,均在Apache 2.0许可下开源。Zonos根据文本提示和说话人嵌入生成自然、高表达性的语音,支持语音克隆功能,可调节语速、音高、情感等参数,输出采样率为44kHz。
20
0
2025-08-31
Zion是一个零代码AI应用开发平台,通过可视化配置和拖拽式交互,大幅降低了应用开发的技术门槛。用户无需编程知识即可快速构建小程序、网站等应用。Zion集成了人工智能技术,提供智能知识库、数据处理等功能,支持个性化定制和业务自动化,旨在提升开发效率和经营效能。
17
0
2025-08-31
Zerox是开源的本地化高精度OCR工具,基于GPT-4o-mini模型,无需提前训练实现零样本识别。Zerox支持PDF、DOCX、图片等多种格式文件,擅长处理扫描版文档及复杂布局文件,如含表格、图表等。Zerox工作流程是将文件转换为图像后进行OCR识别,最终输出Markdown格式文档,方便用户编辑和使用。
16
0
2025-08-31