AI工具第35页_拜读未来科技摆渡人生

SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型

SocraticLM 是通过苏格拉底式的教学法来教授数学的创新人工智能模型，模型由中科大和科大讯飞共同开发，采用了“Thought-Provoking”教学范式，通过提问引导学生主动思考和解决问题。SocraticLM 在名为 SocraTeach 的数据集上进行了微调，该数据集包含 35,000 个精心设计的多轮教学对话，模拟了真实的教学场景。

18 0 2025-08-30

SocioVerse – 复旦大学联合小红书等机构开源的社会模拟世界模型

SocioVerse（众生）是复旦大学、上海创智学院、罗切斯特大学和小红书联合推出的社会模拟世界模型。基于大语言模型（LLM）驱动的智能体和包含1000万真实用户的数据池，构建与现实世界“对齐”的大规模社会模拟框架。

20 0 2025-08-30

Social Media Agent – AI社交媒体内容管理工具，输入URL自动生成帖子

Social Media Agent是智能的社交媒体内容管理工具，基于输入的URL内容生成Twitter和LinkedIn帖子。Social Media Agent用人机交互流程，处理社交媒体平台认证，支持用户修改或接受/拒绝生成的帖子。

16 0 2025-08-30

SnapGen – Snap联合港科大等机构推出的移动端文生图模型

SnapGen是Snap Inc、香港科技大学、墨尔本大学等机构联合推出的文本到图像（T2I）扩散模型，能在移动设备上快速生成高分辨率（1024x1024像素）的图像，且只需1.4秒。模型用379M参数实现这一性能，显著减少模型大小和计算需求，同时在GenEval指标上达到0.66的高分，超越许多参数量更大的SDXL和IF-XL模型。

15 0 2025-08-30

Snap Video – Snapchat公司推出的AI视频生成模型

Snap Video是由Snap公司的研究团队开发的一个AI视频生成模型，目标是通过文本描述来合成视频，即用户可以输入一段描述性的文本，模型能够根据这段文本生成相应的视频内容。由于视频内容具有高度的冗余性和复杂性，Snap Video旨在解决从文本描述生成高质量、时间上连贯、高运动保真度的视频的挑战。

20 0 2025-08-30

SmoothCache – Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache 是用在Diffusion Transformers （DiT）模型的通用推理加速技术，是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散时间步的层输出相似性，自适应地缓存和重用关键特征，减少计算需求。实验显示，SmoothCache 能实现8%到71%的加速，并保持或提升生成质量，适用于图像、视频和音频等多种模态，有助于推动 DiT 模型在实时应用中的广泛使用。

19 0 2025-08-30

SmolVLM – Hugging Face推出的轻量级视觉语言模型

SmolVLM是Hugging Face推出的轻量级视觉语言模型，专为设备端推理设计。以20亿参数量，实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求：SmolVLM-Base：适用于下游任务的微调。SmolVLM-Synthetic：基于合成数据进行微调。SmolVLM-Instruct：指令微调版本，可直接应用于交互式应用中。

22 0 2025-08-30

SmolVLA – Hugging Face开源的轻量级机器人模型

SmolVLA 是 Hugging Face 开源的轻量级视觉-语言-行动（VLA）模型，专为经济高效的机器人设计。拥有4.5亿参数，模型小巧，可在CPU上运行，单个消费级GPU即可训练，能在MacBook上部署。

19 0 2025-08-30

SmolLM2 – Hugging Face推出的紧凑型大语言模型

SmolLLM2是Hugging Face推出用在设备端应用的紧凑型大型语言模型，提供1.7B、360M、135M三个不同参数级别的模型，适应不同的应用场景和资源限制。模型在理解和执行指令、进行知识推理及解决数学问题方面表现出显著的进步。

17 0 2025-08-30

SmolDocling – 轻量级的多模态文档处理模型

SmolDocling（SmolDocling-256M-preview ）是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本，支持文本、公式、图表等多种元素识别，适用于学术论文、技术报告等多类型文档。

17 0 2025-08-30

SmartEraser – 中科大与微软亚洲研究院推出的图像对象移除技术

SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术，专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”（Masked-Region Guidance）范式，与传统的“掩码和修复”（mask-and-inpaint）方法不同，SmartEraser保留掩码区域作为移除过程的引导，能更准确地识别和移除目标对象，同时有效保留周围上下文。

16 0 2025-08-30

Smallpond – DeepSeek开源的轻量级数据处理框架

Smallpond是DeepSeek推出的基于 DuckDB 和 3FS 构建的轻量级数据处理框架，专为高性能和大规模数据处理设计。Smallpond支持处理 PB 级数据集，借助 DuckDB 的高性能分析能力和 3FS 的分布式存储优势，实现高效的数据加载、查询和转换。

22 0 2025-08-30

SlowFast-baidu09LLaVA-baidu091.5 – 苹果推出的多模态长视频理解模型

SlowFast-LLaVA-1.5（简称SF-LLaVA-1.5）是专为长视频理解设计的高效视频大语言模型。基于双流（SlowFast）机制，平衡处理更多输入帧与减少每帧令牌数量之间的关系，能捕捉详细的空间特征，且能高效地处理长时序运动信息。

19 0 2025-08-30

Slidev – 开源AI PPT制作工具，支持Markdown秒变幻灯片

Slidev 是开源的幻灯片制作工具，基于 Markdown + Vue 技术栈实现。工具支持用简单的 Markdown 语法创建幻灯片，支持代码高亮、实时编码演示、数学公式渲染、图表生成等功能，提供丰富的主题和样式选项。

23 0 2025-08-30

SlideChat – 上海AI Lab联合多所高校和机构推出的视觉语言助手

SlideChat是上海AI实验室、厦门大学、华东师范大学等机构推出的，首个能理解千兆像素级别全切片图像的视觉语言助手。SlideChat能生成详尽的全切片图像描述，并针对多样化的病理场景提供具有上下文关联的复杂指令响应。基于训练，SlideChat在多个临床任务中展现出卓越的性能，包括显微镜检查、诊断等。

23 0 2025-08-30

‹‹ ‹ 31 32 33 34 35 36 37 38 39 40 › ››

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30