
在本周美国达人秀(目前是美国第二受欢迎的黄金时段电视节目)的半决赛中,有超过 600 万双眼睛注视着实时 AI 化身技术。

(美国达人秀评委们)
当三位歌手 — Daniel Emmet、Patrick Dailey 和 John Riesen走上舞台,所有观众都在期待,接下来将是一场如何振奋人心的表演

三位歌手开始唱起著名歌剧作品“Nessun Dorma”时候,身后的大屏幕上,三位歌手立刻变脸成为三位评委,从身形姿态及表情,几乎达到以假乱真的地步,毫无违和感。

让评委们大呼精彩,称为“该系列迄今为止最好的表演”和“我们在这个节目中见过的最独特的东西之一”




精彩表演后的AI技术
Metaphysic 是NVIDIA Inception全球科技初创公司网络的成员,也是这次美国达人表演背后的“始作俑者”,也是第一个AI技术进入美国达人决赛。
“很高兴让我们能够在世界上最受关注的舞台之一上展示人工智能的应用。”这家初创公司的联合创始人兼首席执行官Tom Graham说,他与合作伙伴一起出现在节目中。

(从左到右:Daniel Emmet、Tom Graham 和 Chris Umé 在美国达人秀中介绍 Metaphysic)
“虽然近年来人们对合成媒体的总体认识有所提高,但 Metaphysic 的美国达人秀的表演为这项技术如何影响从互联网到娱乐再到教育等一切事物的未来提供了一个前沿席位,”他说。
在提高 AI 意识的同时捕捉想象力
总部位于伦敦的 Metaphysic 成立于 2021 年,正在开发人工智能技术,以帮助创作者构建超现实的虚拟身份和合成内容。
该团队最初在去年为DeepTomCruise病毒式传播,这是一个 TikTok 频道,其中包含演员迈尔斯·费舍尔 (Miles Fisher) 动画汤姆·克鲁斯 (Tom Cruise) 的 AI 化身的视频。格雷厄姆说,这些帖子获得了大约 1 亿次浏览,“让许多人第一次了解了合成媒体令人难以置信的功能”。
通过将其 AI 化身带到美国达人舞台,该公司已经能够接触到数百万的观众——在舞台上使用先进的摄像装置和表演者展示该技术是如何实时和实时工作的。
Metaphysic 的 AI avatar 软件管道包括由NVIDIA Research开发的流行StyleGAN模型的变体。该团队使用 TensorFlow 深度学习框架,依靠NVIDIA CUDA软件来加速其在 NVIDIA GPU 上的工作。
“如果没有 NVIDIA 硬件和软件库,我们将无法将这些超现实结果提升到我们所拥有的水平,”Metaphysic 产品创新总监 Jo Plaete 说。“我们的 NVIDIA 硬件平台提供的计算使我们能够以能够快速迭代它们的速度训练更大、更复杂的模型,从而产生最完美的调整结果。”
对于现场表演期间的 AI 模型开发和推理,Metaphysic 使用NVIDIA DGX系统以及其他配备 NVIDIA GPU(包括NVIDIA A100 Tensor Core GPU )的工作站和数据中心配置。
“出色的硬件支持帮助我们在需要时快速解决问题,”Plaete 说。“并且接触研究和工程团队有助于我们更深入地了解这些工具以及我们如何在我们的管道中利用它们。”
继美国达人之后, Metaphysic 计划在娱乐行业开展多项合作。该公司还推出了一个面向消费者的平台,名为Everyanyone,使用户能够创建自己的超现实 AI 化身。
让我们看看这场完整的美国达人秀表演吧:
欢迎报名NVIDIA GTC大会: