首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >首个中文原生的DiT架构开源模型,腾讯混元文生图大模型全面开源

首个中文原生的DiT架构开源模型,腾讯混元文生图大模型全面开源

作者头像
AIGC新知
发布2024-10-08 19:08:43
发布2024-10-08 19:08:43
3040
举报
文章被收录于专栏:AIGC新知AIGC新知

🚀 腾讯混元文生图大模型,引领AI艺术新潮流

就在今天,腾讯宣布其混元文生图大模型全面升级并对外开源,这不仅是技术的一次飞跃,更是艺术创作的一次革命!

🌟 中文原生,更懂你的文化

作为业内首个中文原生的DiT架构开源模型,腾讯混元文生图不仅支持中英文双语输入及理解,更对汉语字符系统、文化内涵进行了深度学习。

这意味着,无论是古诗词、民间俚语还是传统建筑,都能得到更精准的理解与表达,让艺术创作更加贴近我们的文化根源。

中文元素理解

苏州园林

长城

枯藤老树昏鸦,小桥流水人家

🎨 多轮对话,艺术创作更自由

通过自然语言对话,腾讯混元文生图能够不断微调艺术作品的主体、背景、元素及风格,保持整体画面的高一致性。

无论是想要一名更具德国特色的男性形象,还是一朵室内插瓶的粉色百合,都能通过简单的提示词轻松实现。

📈 表现力提升,质感升级

在人像创作上,腾讯混元文生图实现了质感的大幅提升,减少畸变,支持不同职业、年龄、身材、视角、景别人像的创作。

细粒度语义理解

太阳微微升起,花园里的玫瑰花瓣上露珠晶莹剔透,一只瓢虫正在爬向露珠,背景是清晨的花园,微距镜头。

一只长靴猫手持亮银色的宝剑,身着铠甲,眼神坚毅,站在一堆金币上,背景是暗色调的洞穴,图像上有金币的光影点缀。

一颗新鲜的草莓特写,光泽鲜艳,颜色诱人,被放在绿色的叶子上,背景是棕色的桌面。

无论是细腻的肖像画,还是充满想象力的蒸汽朋克风格雕像,都能通过混元文生图得到完美呈现。

📚 长文本理解,创作灵感无限

腾讯混元文生图还能分析和理解长篇文本中的信息,并据此生成相应的艺术作品。

长文本理解能力演示

人物写真

一位年轻女子站在春季的火车站月台上。

她身着蓝灰色长风衣,白色衬衫。她的深棕色头发扎成低马尾,几缕碎发随风飘扬。

她的眼神充满期待,阳光洒在她温暖的脸庞上。

创意制作

一个异想天开的场景,一只美洲驼,戴着一副超大的圆形太阳镜,自信地站在宇宙飞船的金属甲板上。

美洲驼蹄子下的甲板闪闪发光,抛光的银色,反映了围绕着船只的星空。

在广阔的背景下,地球若隐若现,蓝色的海洋和白色的云层形成了漩涡,与飞船的时尚,未来主义的设计形成了惊人的对比。

艺术风格

后印象主义风格,一条古老的石板路上面散落着金黄色的树叶。

路旁的风车在静谧地转动,后面竖着两个风车。

背景是一片向日葵田,蓝天上飘着几朵白云。

无论是一段描述古代法老的文本,还是一篇描绘未来世界的科幻小说,都能激发混元文生图的创作灵感,转化为视觉艺术。

🌐 全面开源,共建视觉生成生态

腾讯混元文生图大模型已在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,免费供所有企业与个人开发者使用。

这一举措,不仅展示了腾讯的开放态度,更是对整个AI艺术创作领域的一次巨大推动。

🔗 开源地址

想要探索更多,欢迎访问腾讯混元文生图的开源地址:

https://github.com/Tencent/HunyuanDiT

当然也可以在腾讯云体验!

体验链接:https://console.cloud.tencent.com/hunyuan/experience/image

  • 选择水墨画风格的
  • 选择青花瓷风格的
  • 赛博朋克风格
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AIGC新知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档