图像生成技术_拜读未来科技摆渡人生

GPT-4o图像生成架构被“破解”了？自回归主干+扩散解码器，还有4o图像生成全面测评基准

GPT-4o图像生成架构被“破解”了！

StochSync – AI图像生成技术，为360°全景图和3D网格纹理生成高质量图像

StochSync（Stochastic Diffusion Synchronization）是创新的图像生成技术，专门用于在复杂空间（如360°全景图或3D表面纹理）中生成高质量图像。结合了扩散同步（DS）和分数蒸馏采样（SDS）的优势，通过在扩散模型的逆生成过程中引入最大随机性，兼顾图像细节与连贯性。

18 0 2025-08-31

Kandinsky-baidu093 – 开源的文本到图像生成框架，适应多种图像生成任务

Kandinsky-3是基于潜在扩散模型的文本到图像（T2I）生成框架，以高质量和逼真度在图像合成领域脱颖而出。Kandinsky-3能适应多种图像生成任务，包括文本引导的修复/扩展、图像融合、文本-图像融合及视频生成等。研究者们推出一个简化版本的T2I模型版本，该版本在保持图像质量的同时，将推理速度提高3倍，仅需4步逆向过程即可完成。

18 0 2025-08-29

Illustrious – 开源文本到图像生成模型，专注于生成高质量动漫风格图像

Illustrious是开源的文本到图像动漫图像生成模型，是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键方法，实现高分辨率、动态色域和高还原能力的图像生成。模型在动画风格的表现上超越如Stable Diffusion XL和其他一些广泛使用的动漫图像生成模型，并支持易于定制和个性化的开源特性。

18 0 2025-08-29

EveryoneNobel – AI图像生成工具，生成个性化诺贝尔奖风格图像

EveryoneNobel是一个开源AI工具，为每个人生成个性化的诺贝尔奖风格图像。EveryoneNobel基于ComfyUI框架，结合HTML模板和图像生成技术，用户只需上传肖像照片、提供基本信息，如姓名和获奖主题，系统能自动生成独具特色的诺贝尔奖“奖状”。

20 0 2025-08-28

‹‹ 1 ››

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30