OpenAI宣布开发出一款创新的生成式人工智能,名为“Voice Engine”,能够精准模仿人类的声音。这项技术仅需短短15秒的语音样本,便能合成极为相似的声音,并支持多语言转换。OpenAI强调对此技术的安全应用抱持谨慎态度,并未立即公开,而是选择先进行试验性应用以确保安全。
OpenAI在推出开发对话型AI“ChatGPT”后再次推出能够复刻人声的“Voice Engine”。只需要15秒的语音样本和文本输入,即能制作出与原声极为相似的语音输出,甚至能转换成非母语的外语发音。
“Voice Engine”技术不仅能实现更真实的人声复刻,而且还能应用于各种场景,如为孩童朗读故事、企业产品介绍、医疗咨询服务,以及为语言障碍者提供帮助,支持多种语言,且能模仿语调和情感。
合成语音技术同样会担心会被滥用。为此OpenAI决定不急于完全公开“Voice Engine”。公司强调生成逼真人声带来的风险巨大,尤其在选举期间,需要格外小心。OpenAI正与政府和外部企业合作,并采取必要的安全措施。
OpenAI于2月推出了视频生成AI“Sora”,该技术同样未对外公开。面对生成型AI技术日益普及所引发的滥用风险,OpenAI对商用化明显采取较审慎态度,以确保安全和负责任的使用。
官方网站上展示了详细应用方式。
数据源:APNews,OpenAI
领取专属 10元无门槛券
私享最新 技术干货