华为发布图像生成模型PixArt-\Sigma 可直出4K图像

华为近日发布了一项名为 PixArt-\Sigma 的图像生成模型,该模型采用了 DiT 架构,可以直接生成4K 分辨率的图像。相比于其前身 PixArt-\alpha,PixArt-\Sigma 在图像保真度上有了明显的提升,并改善了与文本提示的一致性。

华为发布图像生成模型PixArt-\Sigma 可直出4K图像 第2张插图

PixArt-\Sigma 的一个关键特点是其训练效率。借助 PixArt-\alpha 的基础预训练,它通过整合更高质量的数据,从”较弱”的基线逐步演变为”较强”的模型,这个过程被称为”弱到强训练”。PixArt-\Sigma 的进步主要体现在两个方面:高质量的训练数据和高效的 Token 压缩。PixArt-\Sigma 结合了更高质量的图像数据,配对更精确和详细的图像标题,同时在 DiT 框架内提出了一个新的注意力模块,可以压缩键(Key)和值(Value),显著提高效率,促进超高分辨率图像的生成。

由于这些改进,PixArt-\Sigma 以较小的模型规模(6亿参数)实现了优于现有文本到图像扩散模型(如 SDXL(26亿参数)和 SD Cascade(51亿参数))的图像质量和用户提示遵从能力。

此外,PixArt-\Sigma 能够生成4K 图像,为创建高分辨率海报和壁纸提供了支持,有效地增强了电影和游戏等行业中高质量视觉内容的制作。

项目部署地址:

华为发布图像生成模型PixArt-\Sigma 可直出4K图像 第3张插图
此处内容已隐藏,评论后刷新即可查看!

免责声明

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络收集整理,如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!
如若转载,请注明出处:https://www.zxki.cn/9099.html

上一篇 2024-3-9 09:47
下一篇 2024-3-10 09:57

相关推荐

发表评论

为了防止灌水评论,登录后即可评论!

已有 5 条评论