你是否有过这样的经历,看到一部精彩的外国电影或者视频,却因为没有中文字幕或者配音而感到沮丧?
你是否想过,如果你能把自己的作品翻译成其他语言,就可以让更多的人欣赏和分享?
如果你有这样的困扰,那么ElevenLabs的AI配音产品可能是你的救星。
ElevenLabs是一家成立于2022年的声音克隆和合成的初创公司,由前谷歌和Palantir的员工创立。它今天宣布推出了AI配音产品,这是一个专门的产品,可以把任何语音,包括长篇内容,翻译成20多种不同的语言。
ElevenLabs它的拿手好戏是什么?
再次之前,它是一家优秀的文本生成语音公司,能够提供具有丰富感情的文本朗读能力。
ElevenLabsAI配音:它的前景如何?
这个产品对所有平台用户开放,它提供了一种新的方式来给音频和视频内容配音,可以改变这个领域多年来一直依赖人工的局面。更重要的是,它可以打破语言障碍,让那些没有资源雇佣人工翻译者来转换他们内容的小型内容创作者,也能把他们的作品推向全球。
“我们与数百名内容创作者合作测试和迭代了这个功能,让他们的内容更容易被更广泛的受众接受”,ElevenLabs的首席执行官兼联合创始人Mati Staniszewski对VentureBeat说。“我们看到了巨大的潜力,从那些创造视频内容和播客的独立创意人士,一直到电影和电视制作公司。”
AI配音:它是如何工作的?
虽然AI驱动的翻译涉及多层工作,从去噪到语音翻译,但前端用户不必经历任何这些步骤。他们只需要在ElevenLabs上选择AI配音工具,创建一个新项目,选择源语言和目标语言,并上传内容文件。
一旦内容上传完成,工具会自动检测说话者的数量,并开始工作,在屏幕上显示一个进度条。这就像互联网上任何其他转换工具一样。完成后,文件就可以下载和使用了。
在幕后,工具通过利用ElevenLabs专有的方法来去除背景噪音,区分出真正对话中的音乐和噪声。它识别出哪些说话者在什么时候说话,并保持他们声音的区别,并使用语音到文本模型将他们在原始语言中说的话转录成文本。
然后,这些文本被翻译,调整(使长度匹配)并用目标语言发声,以产生所需的语音,同时保留说话者原来的声音特征。最后,翻译后的语音与最初从文件中移除的音乐和背景噪音重新同步,准备好配音输出以供使用。
ElevenLabs声称这项工作是其在声音克隆、文本和音频处理以及多语言语音合成方面的研究成果。
AI配音:它有什么优势?
ElevenLabs的AI配音产品有几个明显的优势,可以让它在竞争中脱颖而出。
首先,它支持多种语言,包括英语、中文、日语、法语、德语、西班牙语、俄语、阿拉伯语等。这意味着用户可以把他们的内容翻译成任何他们想要的目标市场的语言。
其次,它可以保留说话者原来的声音特征,包括他们的情感和语调1。这可以让内容更加真实和有吸引力,而不是像机器人一样平淡无味。用户甚至可以自定义说话者的声音参数,比如音高、速度和音量。
第三,它可以处理长篇内容,比如电影、电视节目、播客等。这是一个很大的挑战,因为长篇内容需要更多的计算资源和更高的准确性。ElevenLabs利用了其强大的云计算能力和先进的深度学习技术,来实现这一目标。
第四,它可以提供快速和低成本的服务。ElevenLabs声称它可以在几分钟内提供高质量的翻译语音,而不是几天或几周。而且,它的价格也比传统的人工翻译和配音服务要低得多。
AI配音:它有什么局限性?
当然,ElevenLabs的AI配音产品也不是完美无缺的。它还有一些局限性和挑战,需要用户注意。
首先,它可能无法完全捕捉到说话者原来的意思和文化背景。语言是一种复杂而丰富的表达方式,有时候直接翻译是不够的。有些词汇或者习惯用语可能在不同的语言中没有对应的表达方式,或者有不同的含义和感情色彩。因此,用户可能需要对翻译后的内容进行一些修改或者校对,以确保没有失真或者误解。
其次,它可能无法适应所有类型和风格的内容。不同类型和风格的内容可能需要不同程度和方式的翻译和配音。比如,一个喜剧片可能需要更多的幽默感和轻松氛围,而一个恐怖片可能需要更多的紧张感和恐惧感。ElevenLabs可能无法完全模拟出这些细微而重要的差别。
如何体验?
可以去官网来登陆体验一下他们的文生音,或者AI配音功能
官网地址:
https://elevenlabs.io/
领取专属 10元无门槛券
私享最新 技术干货