Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型,通过独特的三阶段强化学习训练方法,在时间推理能力上取得了显著突破。
22
0
2025-08-31
Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。是首个开源推理模型,训练数据集和代码均已公开,用户可以从零开始复现该模型。
21
0
2025-08-30
Qwen2.5-Coder 是阿里Qwen 团队推出的全系列代码生成模型,推动开源代码语言模型的发展。在代码生成、代码推理、代码修复等任务上表现出色。系列涵盖了不同规模的模型1.5B/7B/0.5B/3B/14B/32B的六个主流模型尺寸,满足不同开发者的需求。
19
0
2025-08-30
PixelWave Flux.1-dev 03是基于FLUX.1-dev模型在NVIDIA 4090上微调的AI图像生成模型,有卓越的模型泛化能力,模型在处理多种艺术风格、摄影和动漫图像方面表现出色,在审美、写实和动漫风格上有明显的提升。
20
0
2025-08-30
Phi-3.5是微软推出的新一代AI模型系列,包含 Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct 三个版本,分别针对轻量级推理、混合专家系统和多模态任务设计。
16
0
2025-08-30
Molmo 72B是由艾伦人工智能研究所(Ai2)推出的一个开源多模态AI模型,专门设计用于处理和理解图像和文本数据。基于Qwen2-72B模型,使用OpenAI的CLIP作为视觉编码器。Molmo 72B在多个学术基准测试中表现优异,击败包括Llama 3.2 90B在内的其他模型。
20
0
2025-08-30
22
0
2025-08-30
18
0
2025-08-30
Llama 3.2是Meta公司最新推出的开源AI大模型系列,包括小型和中型视觉语言模型(11B和90B参数)以及轻量级纯文本模型(1B和3B参数)。Llama 3.2模型专为边缘设备和移动设备设计,支持128K令牌的上下文长度,并针对高通和联发科硬件进行优化。
20
0
2025-08-29
GPT-4o Long Output模型是OpenAI最新推出的超长输出AI模型,支持高达64k tokens的长文本输出,相当于约200页小说。相较于原GPT-4o模型,输出能力提升16倍,但输入上限降至64k tokens,满足用户对更长文本处理的需求。
23
0
2025-08-29
EXAONE 3.5是LG AI研究院推出的开源AI模型,包含24亿、78亿和320亿参数的三个版本。EXAONE 3.5擅长长文本处理,在基准测试中表现优异,特别是在实际应用、长文本处理和数学方面。模型采用检索增强生成技术和多步推理能力,有效降低错误信息,提高准确性。
24
0
2025-08-28
AnimePro FLUX是基于Apache 2.0许可的动漫风格图像生成模型,专为生成高质量二次元插画设计。AnimePro FLUX基于Flux.1 Shnell模型微调,克服DEV版本的许可限制,产生媲美Dev和Pro级别的图像。模型在RTX 3090 GPU上运行速度超过SDXL,支持4-8步生成,超过10步进入细化模式。
24
0
2025-08-28
AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学共同推出的简化2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画,遵循参考角色设计。模型用对应匹配技术处理角色设计与草图之间的差异,实现色彩和风格的准确传递。
23
0
2025-08-27