开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

智谱清言App新功能上线，CogView3-Plus文生图模型来了？

文章来源：企鹅号 - ITBear科技资讯

【ITBEAR】智谱技术团队近日宣布，其最新研发的文生图模型CogView3及CogView3-Plus-3B已正式开源，并已在“智谱清言”App上线。这一系列模型展现了强大的文本到图像的生成能力。

CogView3模型基于级联扩散机制，分为三阶段：首先生成512x512低分辨率图像，然后通过中继扩散过程实现2倍超分辨率，最终生成2048x2048高分辨率图像。

据官方介绍，CogView3在人工评估中表现卓越，比目前最先进的开源文本到图像扩散模型SDXL高出77.0%，且推理时间仅需SDXL的约十分之一。

而CogView3-Plus模型则在CogView3的基础上，引入了最新的DiT框架，采用Zero-SNR扩散噪声调度，并加入文本-图像联合注意力机制，进一步提升了整体性能。

发表于: 2024-10-142024-10-14 14:18:21
原文链接：https://page.om.qq.com/page/OJG5wZKvIZo5yXeTXzyww2zg0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

相关快讯