OpenAI Voice Engine模模拟人声音顾及安全问题暂不对外公开

文章来源：企鹅号 - 十轮网科技

OpenAI宣布开发出一款创新的生成式人工智能，名为“Voice Engine”，能够精准模仿人类的声音。这项技术仅需短短15秒的语音样本，便能合成极为相似的声音，并支持多语言转换。OpenAI强调对此技术的安全应用抱持谨慎态度，并未立即公开，而是选择先进行试验性应用以确保安全。

OpenAI在推出开发对话型AI“ChatGPT”后再次推出能够复刻人声的“Voice Engine”。只需要15秒的语音样本和文本输入，即能制作出与原声极为相似的语音输出，甚至能转换成非母语的外语发音。

“Voice Engine”技术不仅能实现更真实的人声复刻，而且还能应用于各种场景，如为孩童朗读故事、企业产品介绍、医疗咨询服务，以及为语言障碍者提供帮助，支持多种语言，且能模仿语调和情感。

合成语音技术同样会担心会被滥用。为此OpenAI决定不急于完全公开“Voice Engine”。公司强调生成逼真人声带来的风险巨大，尤其在选举期间，需要格外小心。OpenAI正与政府和外部企业合作，并采取必要的安全措施。

OpenAI于2月推出了视频生成AI“Sora”，该技术同样未对外公开。面对生成型AI技术日益普及所引发的滥用风险，OpenAI对商用化明显采取较审慎态度，以确保安全和负责任的使用。

官方网站上展示了详细应用方式。

数据源：APNews,OpenAI

相关快讯