当前是探索人工智能最激动人心的时刻。每周都有新模型发布,意想不到的用例不断涌现,人们以既奇特又令人愉悦的方式不断突破边界。
以下是正在发生的一些精彩亮点——你可以尝试的新模型、来自社区的创意实验以及新颖的创作。
ShieldGemma 2是一个强大的新模型,能够高精度地检测NSFW内容、暴力材料和不安全指令。这是某机构在其平台上的首个此类模型,对于构建更安全的AI体验——特别是面向社交或用户的应用——是一个有用的工具。
Hunyuan3D 2Mini是其早期3D生成模型的一个更快、更小的版本。它非常适合游戏资产创建和风格化角色创作,并且已经出现在某社交平台的工作流程中,创作者可以用它以前所未有的速度构建充满活力的3D世界。
这些新的语音模型不仅能说话——它们还能呼吸、停顿和轻笑。凭借内置的类人特性,它们非常适合用于逼真的语音、游戏对话,或者只是让你的AI听起来更有活力。
某中心的模型现在能在约30秒内生成720p视频,使得将文本转换为电影级视频的速度比以往任何时候都快。如果优先考虑速度,还有一个更轻量的版本可用于生成540p输出。
另一款模型v1.6 Pro版本引入了结束帧支持,让你对视频生成有更多控制。现在起始帧和结束帧都可用,更容易引导你的视频达到完美的时机和构图。结合其1080p分辨率,该模型是生成更清晰、更具动态感视频效果的强大工具。
在Wan2.1模型上使用自定义LoRA创建诸如“蛋糕化”、“挤压”和“溶解”等效果,正在引领奇特而迷人的转变。使用像“蛋糕化”这样的自定义LoRA进行微调,能带来令人惊讶的灵活结果。通过调整LoRA权重并修改提示词,你可以将一把刀换成任何手持物品——一把斧头、一把光剑,甚至一支牙刷——并将其内部物体变成非蛋糕的其他东西。
如果你有兴趣微调自己的模型,有两个强大的工具可用:
Flux、Kling和Wan2.1等模型正在推动病毒式创意的激增——包括动画人物和AI生成的虚拟形象。
本期内容到此为止,但请继续关注更多关于模型、实验和值得一试的酷炫想法。在此期间,你可以在某平台探索新事物,并在某社交平台上关注我们,以实时了解社区正在构建的内容。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。