品玩6月25日讯,据 huggingface 页面显示,谷歌研究团队近日推出一款大语言模型产品 AudioPaLM,可以实现语音理解和生成功能。
AudioPaLM 将两个大语言模型 PaLM-2 和 AudioLM 融合到一个统一的多模态架构之中,利用该架构处理和生成文本和语音。 AudioPaLM 还支持语音识别以及语音翻译。
试验表明,AudioPaLM 的表现显著优于现有的语音翻译系统。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货