Time-R1是伊利诺伊大学香槟分校研究团队开发的基于3B参数的语言模型,通过独特的三阶段强化学习训练方法,在时间推理能力上取得了显著突破。
22
0
2025-08-31
SwiftBrush V2 是文本到图像的单步扩散模型,通过改进训练方法和模型融合技术,实现与多步Stable Diffusion扩散模型相媲美的性能。模型通过更好的权重初始化、高效的LoRA训练,引入一种新颖的夹紧CLIP损失来增强图像与文本的对齐,提高图像质量。
22
0
2025-08-31
Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。是首个开源推理模型,训练数据集和代码均已公开,用户可以从零开始复现该模型。
22
0
2025-08-30
Qwen2.5-Coder 是阿里Qwen 团队推出的全系列代码生成模型,推动开源代码语言模型的发展。在代码生成、代码推理、代码修复等任务上表现出色。系列涵盖了不同规模的模型1.5B/7B/0.5B/3B/14B/32B的六个主流模型尺寸,满足不同开发者的需求。
19
0
2025-08-30
Phi-3.5是微软推出的新一代AI模型系列,包含 Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct 三个版本,分别针对轻量级推理、混合专家系统和多模态任务设计。
16
0
2025-08-30
19
0
2025-08-30
AnimePro FLUX是基于Apache 2.0许可的动漫风格图像生成模型,专为生成高质量二次元插画设计。AnimePro FLUX基于Flux.1 Shnell模型微调,克服DEV版本的许可限制,产生媲美Dev和Pro级别的图像。模型在RTX 3090 GPU上运行速度超过SDXL,支持4-8步生成,超过10步进入细化模式。
24
0
2025-08-28