IT之家 9 月 25 日消息,Spotify 正在测试一项新的人工智能功能,该功能名为“语音翻译(Voice Translation)”,该功能可以克隆播客主播的声音,并用该声音使用另一种语言读出播客。
该工具由 Spotify 在 OpenAI 的自动语音识别 (ASR) 系统 Whisper 的帮助下开发的,使用了语音转文本生成 AI 模型来翻译音频文件,并使用语音复制模型来匹配原始说话者的风格。
IT之家注意到,首批参与这一新功能的主持人包括戴克斯・夏普德、莫妮卡・帕德曼、莱克斯・弗里德曼、比尔・西蒙斯和史蒂文・巴特利特。不过,并非他们各自播客的每一集都会立即以多种语言提供,并且目前只提供西班牙语翻译版本。
Spotify 表示,未来几天和几周内将推出更多剧集,还将提供法语和德语翻译。
领取专属 10元无门槛券
私享最新 技术干货