2024年3月29日,OpenAI宣布推出了一项令人振奋的技术—Voice Engine
这一技术可以根据仅15秒的音频样本,生成非常自然且接近原始说话者的语音。还可以通过文本输入,控制生成的内容。
其实在2022年底,OpenAI就已经开发了Voice Engine这个语音AI。但是因为潜在的风险(担心滥用,导致诈骗)所以一直没有大规模公布,只是小范围的内侧使用。内测的结果十分理想,使用过的人都震惊这项技术。
虽然风险很大,但是这项技术的前景也是很巨大的。可以在教育领域推广,比如官方介绍的一家儿童教育技术公司,他们用AI技术生成画外音,还可以个性化的与学生互动。
还有是对于视频网站,或者演讲者。当他们想要把声音以多个语言翻译时,这项技术就有用武之地了。
OpenAI采取了谨慎的策略,确保合成语音的负责任使用。我们需要思考如何保护原始发言者的声音不被滥用,以及如何防止模仿公众人物的声音。当能有行之有效的方法时候,也就是这项技术可以大规模运用的时候了。
领取专属 10元无门槛券
私享最新 技术干货