neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型

SocraticLM – 中科大和科大讯飞共同推出的苏格拉底教学大模型

SocraticLM 是通过苏格拉底式的教学法来教授数学的创新人工智能模型,模型由中科大和科大讯飞共同开发,采用了“Thought-Provoking”教学范式,通过提问引导学生主动思考和解决问题。SocraticLM 在名为 SocraTeach 的数据集上进行了微调,该数据集包含 35,000 个精心设计的多轮教学对话,模拟了真实的教学场景。
18 0 2025-08-30
SnapGen – Snap联合港科大等机构推出的移动端文生图模型

SnapGen – Snap联合港科大等机构推出的移动端文生图模型

SnapGen是Snap Inc、香港科技大学、墨尔本大学等机构联合推出的文本到图像(T2I)扩散模型,能在移动设备上快速生成高分辨率(1024x1024像素)的图像,且只需1.4秒。模型用379M参数实现这一性能,显著减少模型大小和计算需求,同时在GenEval指标上达到0.66的高分,超越许多参数量更大的SDXL和IF-XL模型。
15 0 2025-08-30
Snap Video – Snapchat公司推出的AI视频生成模型

Snap Video – Snapchat公司推出的AI视频生成模型

Snap Video是由Snap公司的研究团队开发的一个AI视频生成模型,目标是通过文本描述来合成视频,即用户可以输入一段描述性的文本,模型能够根据这段文本生成相应的视频内容。由于视频内容具有高度的冗余性和复杂性,Snap Video旨在解决从文本描述生成高质量、时间上连贯、高运动保真度的视频的挑战。
20 0 2025-08-30
SmoothCache – Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache – Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache 是用在Diffusion Transformers (DiT)模型的通用推理加速技术,是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散时间步的层输出相似性,自适应地缓存和重用关键特征,减少计算需求。实验显示,SmoothCache 能实现8%到71%的加速,并保持或提升生成质量,适用于图像、视频和音频等多种模态,有助于推动 DiT 模型在实时应用中的广泛使用。
19 0 2025-08-30
SmolVLM – Hugging Face推出的轻量级视觉语言模型

SmolVLM – Hugging Face推出的轻量级视觉语言模型

SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求:SmolVLM-Base:适用于下游任务的微调。SmolVLM-Synthetic:基于合成数据进行微调。SmolVLM-Instruct:指令微调版本,可直接应用于交互式应用中。
22 0 2025-08-30
SmolVLA – Hugging Face开源的轻量级机器人模型

SmolVLA – Hugging Face开源的轻量级机器人模型

SmolVLA 是 Hugging Face 开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,模型小巧,可在CPU上运行,单个消费级GPU即可训练,能在MacBook上部署。
19 0 2025-08-30
SmolLM2 – Hugging Face推出的紧凑型大语言模型

SmolLM2 – Hugging Face推出的紧凑型大语言模型

SmolLLM2是Hugging Face推出用在设备端应用的紧凑型大型语言模型,提供1.7B、360M、135M三个不同参数级别的模型,适应不同的应用场景和资源限制。模型在理解和执行指令、进行知识推理及解决数学问题方面表现出显著的进步。
17 0 2025-08-30
SmolDocling – 轻量级的多模态文档处理模型

SmolDocling – 轻量级的多模态文档处理模型

SmolDocling(SmolDocling-256M-preview )是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本,支持文本、公式、图表等多种元素识别,适用于学术论文、技术报告等多类型文档。
17 0 2025-08-30
SmartEraser – 中科大与微软亚洲研究院推出的图像对象移除技术

SmartEraser – 中科大与微软亚洲研究院推出的图像对象移除技术

SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术,专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”(Masked-Region Guidance)范式,与传统的“掩码和修复”(mask-and-inpaint)方法不同,SmartEraser保留掩码区域作为移除过程的引导,能更准确地识别和移除目标对象,同时有效保留周围上下文。
16 0 2025-08-30
Smallpond – DeepSeek开源的轻量级数据处理框架

Smallpond – DeepSeek开源的轻量级数据处理框架

Smallpond是DeepSeek推出的基于 DuckDB 和 3FS 构建的轻量级数据处理框架,专为高性能和大规模数据处理设计。Smallpond支持处理 PB 级数据集,借助 DuckDB 的高性能分析能力和 3FS 的分布式存储优势,实现高效的数据加载、查询和转换。
22 0 2025-08-30
Slidev – 开源AI PPT制作工具,支持Markdown秒变幻灯片

Slidev – 开源AI PPT制作工具,支持Markdown秒变幻灯片

Slidev 是开源的幻灯片制作工具,基于 Markdown + Vue 技术栈实现。工具支持用简单的 Markdown 语法创建幻灯片,支持代码高亮、实时编码演示、数学公式渲染、图表生成等功能,提供丰富的主题和样式选项。
23 0 2025-08-30
SlideChat – 上海AI Lab联合多所高校和机构推出的视觉语言助手

SlideChat – 上海AI Lab联合多所高校和机构推出的视觉语言助手

SlideChat是上海AI实验室、厦门大学、华东师范大学等机构推出的,首个能理解千兆像素级别全切片图像的视觉语言助手。SlideChat能生成详尽的全切片图像描述,并针对多样化的病理场景提供具有上下文关联的复杂指令响应。基于训练,SlideChat在多个临床任务中展现出卓越的性能,包括显微镜检查、诊断等。
23 0 2025-08-30