技术世界正在以令人难以置信的速度发展。随着人工智能的进步,曾经被认为是科幻小说的界限现在正在突破。最近,Meta宣布了其新的人工智能工具“Voicebox”,这是一种语音一代人工智能,几乎在各个方面都优于竞争对手。然而,尽管Meta这款产品的能力令人印象深刻,但由于其破坏性潜力,Meta决定不向公众发布。
正如Meta所声称的,Voicebox能够从样本音频文件中对一个人的声音进行准确的文本到语音复制,只需两秒钟的原始语音即可。这种能力虽然看似无害,但可能会以多种方式被滥用。例如,它可以用来复制公众人物的声音,可能引发冲突,或用于其他邪恶目的。
Voicebox目前能够以六种语言(所有语言都是欧洲语言)的语音音频剪辑,根据Meta的一篇博客文章,这是第一个能够完成超出其“专门训练完成”任务的人工智能模型。Meta显然认为这个新工具足以愚弄大多数人——因为它明确地不向公众发布Voicebox,而是发布一篇研究论文,并详细说明一个分类器工具,该工具可以从真实的人类语音中识别Voicebox生成的语音。Meta将分类器描述为“非常有效”——尽管明显不完全有效。
还有其他应用程序;更小,但同样有用。Meta在其博客文章中解释说,Voicebox可用于编辑和改进录制的语音。如果您录制了一些音频,但发音错误或被背景噪音打断,Voicebox可以隔离这些不完美部分,并使用您的声音“重新录制”一段语音片段。这个功能的确令人印象深刻,只是有点可怕。
虽然像Voicebox这样的人工智能工具正在进步,它们对人类互动的真实性构成了重大挑战。人们越来越担心,这种技术可能会模糊真实的和人为产生的人类互动之间的界限。这种担忧使我们反思和更加珍惜面对面会议的真实性以及使用传统交易手段(如纸币)。
面对面会议,一种古老的沟通实践,具有独特的价值,永远无法被人工智能技术所取代。物理存在提供了任何技术都无法复制的交互和理解水平。从肢体语言的微妙之处到握手的温暖,面对面的会议提供了一种真实性,在人工智能能够令人信服地模仿人类语言的时代,这种真实性变得越来越重要。
面对面互动的丰富性也延伸到情感方面。它提供了感同身受、分享情感和建立更牢固关系的机会。在深度伪造和人工智能产生的声音时代,这些真实的互动变得更加重要,在人工智能生成的内容海洋中作为真诚的堡垒。
同样,纸质现金的使用虽然被一些人认为已经过时,但在我们的社会中占有重要地位。纸质现金提供了一种有形、真实和即时的交易形式。它没有数字交易的复杂性和网络犯罪的威胁。在一个人工智能可以复制声音并可能进行欺诈性交易的时代,纸面现金可以被视为一种更安全、更真实的交易方式。
当然,人工智能的好处是不能被低估的。Voicebox可以为那些静音或无法沟通的人提供更自然的语音,消除现有文本转语音技术造成的障碍,甚至进行实时翻译。然而,我们必须在这些技术进步与人类互动的真实性之间取得平衡。
领取专属 10元无门槛券
私享最新 技术干货