将任意图片变成手办prompt:turn this photo into a character figure. Behind it, place a box with the character’s image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on.
将这张照片转化为一个角色形象。在其背后放置一个盒子,盒子上印有该角色的图像,盒子上方的电脑屏幕上显示Blender建模过程。在盒子前方添加一个圆形塑料底座,角色形象站立其上。
nano-banana-7-1.png
nano-banana-8-1.png
卡通变现实prompt:Depict as a live big budget costume test on set, shot on film.
Variant Prompt: For easier additional editing.Depict as a live big budget costume test on set, shot on film against green screen.
描绘成在片场进行的大预算服装试穿,使用胶片拍摄。
变体提示:为了更轻松地进行额外编辑,描绘成现场的大预算服装测试,在片场拍摄,使用胶片对绿幕拍摄。
nano-banana-11-1.png
360度产品展示prompt:This exact car in this exact environment.
Change Perspective: Perfect side angle view.
这辆汽车及其确切环境。
改变视角:完美的侧面角度视图
生成不同视角的图片后,用可灵2.1通过首尾帧生成视频。
nano-banana-12-1.png
姿态参考prompt:Model pose like the sketch.
提示词:模特姿势变得像草图一样。
nano-banana-32-1.png
图像位置参考
直接在图中标记位置,Nano Banana 就可以生成准确的图像。
nano-banana-33-1.png
nano-banana-34-1.png
漫画生成
准备角色参考的图片,三视图缺一不可。
nano-banana-35-1.png
标记分区
nano-banana-36-1.png
在图中加入提示词,生成漫画:
nano-banana-38-1.png
系列IP/动漫角色生成prompt:First, please set up the basic color palette and the shadows and saturation.
提示词:首先,请设置基本色板和阴影与饱和度。
prompt:Next, please do the character model sheet.
接下来,请制作角色模型表。
prompt:Next, please provide the [basic action set].
接下来,请提供基本动作集。
prompt:Please give me the costume design set.
提示词:请给我服装设计套装。
prompt:Please make an expression sheet.
提示词:请制作表情表。
USO(Unified Style and Subject-Driven Generation via Disentangled and Reward Learning)是由字节跳动智能创作实验室开发并开源的统一风格与主体驱动生成模型。该项目旨在解决传统上将风格驱动和主体驱动生成视为独立任务的局限性,通过一个统一的框架实现二者的融合,能够自由地将任意主体与任意风格结合,生成高质量的图像内容。
uso.png
uso1.png
核心功能
统一图像生成: 能够在一个框架内同时进行风格驱动和主体驱动的图像生成。
高保真度输出: 确保生成图像在主体一致性、身份保持以及风格保真度方面达到领先水平。
自然人像生成: 特别优化生成自然、无“塑料感”的人像。
灵活组合能力: 允许用户自由组合不同的主体和风格,以适应多样化的创作需求。
性能评估基准: 发布了USO-Bench,作为首个联合评估风格相似性和主体保真度的开放基准。
技术原理
USO的核心技术在于其解耦与奖励学习(Disentangled and Reward Learning)机制。它通过精巧的算法设计,实现“内容”和“风格”的有效解耦和重组,从而克服了传统方法中风格和主体生成之间的内在矛盾。该模型构建在一个统一的生成框架之上,利用深度生成模型(如基于FLUX.1-dev的模型)进行图像合成。此外,它通过引入奖励学习进一步提升模型性能,确保生成结果的自然度和一致性。项目还进行了GPU内存优化,使其在消费级GPU(峰值显存约16GB)上也可运行。