某中心发布了FLUX.2,这是其迄今为止最先进的图像生成模型。此次发布在图像质量、编辑能力和企业级效率方面带来了显著改进。FLUX.2现在可以在Replicate上运行。
FLUX.2提供三种变体:
FLUX.2 pro 在6秒内生成图像,或在使用输入图像时9秒内生成。它最多可接受8个输入图像,成本为0.015美元加上每输入和输出百万像素0.015美元。
FLUX.2 flex 生成质量更高的图像,尤其是在排版和精细细节方面。它在22秒内生成图像,或在使用输入图像时40秒内生成。FLUX.2 flex最多可接受10个输入图像,成本为每输入和输出百万像素0.06美元。
FLUX.2 dev 是FLUX.2 pro的开源蒸馏版本,已与某机构合作进行了优化。它在2.5秒内生成图像,或在使用输入图像时5.5秒内生成,成本为每输入和输出百万像素0.012美元。
细节缩小生成与真实之间的差距
FLUX.2生成高达4MP分辨率的逼真图像细节。该模型擅长渲染准确的手、面部、织物、标志和小物体,这些通常是其他模型容易忽略的。这种保真度使其非常适合创意摄影、电子商务产品图、营销材料、室内设计和图像重塑风格。
企业级效率
FLUX.2以低延迟和可预测的成本提供最先进的视觉智能。无论是生成新图像还是编辑现有图像,该模型都能高效处理复杂的视觉问题,使得即使在大批量图像处理时也能获得专业质量的AI服务。
具有角色一致性的多参考编辑
FLUX.2的一个突出特点是能够同时参考多达8个图像,同时保持一致的身份、产品和风格。这意味着可以使用同一张脸创建50个广告变体,在任何背景下生成产品模型,或制作动态时尚社论,其中模型在所有镜头中保持一致。
专业精度
FLUX.2提供精确姿势控制、符合品牌指南的十六进制颜色代码准确性,以及将视觉提示与输入图像结合以进行局部编辑的能力。该模型处理干净的背景替换和匹配透视关系的对象插入,局部编辑不会影响图像的其余部分。所有这些功能都支持任何宽高比。
为规模化构建
该模型包括用于程序化工作流的结构化提示、32K提示令牌用于详细的创意指导,以及用于生成后编辑的生成性扩展/裁剪功能。速度和质量等级可适应特定的工作流程需求。
适合互联网内容
FLUX.2足够理解上下文、语调和趋势,可以从简短提示中单次生成吸引人的帖子、表情包和社论视觉效果。
FLUX.2相较于前代带来了几项关键改进:
FLUX.2专为大规模生成专业视觉内容的用户设计:营销团队、产品设计师、内容创作者、社交媒体经理、电子商务品牌、代理机构、构建视觉应用的开发人员、出版商和教育工作者。
以下是如何使用JavaScript和Replicate API运行FLUX.2:
import Replicate from "replicate";
const replicate = new Replicate({
auth: process.env.REPLICATE_API_TOKEN,
});
const output = await replicate.run(
"black-forest-labs/flux-2-pro",
{
input: {
prompt: "A professional product photo of a sleek smartwatch on a marble surface, studio lighting",
aspect_ratio: "16:9",
output_format: "webp",
output_quality: 90
}
}
);
console.log(output);或使用Python:
import replicate
output = replicate.run(
"black-forest-labs/flux-2-pro",
input={
"prompt": "A professional product photo of a sleek smartwatch on a marble surface, studio lighting",
"aspect_ratio": "16:9",
"output_format": "webp",
"output_quality": 90
}
)
print(output)FLUX.2代表了AI图像生成和编辑领域的重大飞跃。凭借其照片级真实感的细节、多参考一致性和企业级效率的结合,它已准备好处理任何规模的专业视觉内容创作。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。