首页
学习
活动
专区
圈层
工具
发布

谷歌全新实时语音互译模型发布:支持70余种语言,可还原原声语调

【太平洋科技快讯】谷歌发布全新实时语音互译模型Gemini 3.5 Live Translate。

该模型可自动识别70余种语言,翻译语音能够还原说话者的语调、语速与音高。和传统翻译系统不同,它无需等待整段话语结束再执行翻译,可边接收语音边输出译文,在兼顾上下文理解与翻译时效之间实现平衡,整体延迟仅数秒。

目前该模型已开始逐步落地谷歌旗下各类产品。开发者可通过Gemini Live API与Google AI Studio体验公开预览版本;企业用户本月起可在Google Meet中使用专属私有预览版;普通用户则能在安卓、iOS端的谷歌翻译App中体验相关功能。

Gemini 3.5 Live Translate可自动识别混合语言输入,同时具备不错的抗干扰能力,适配嘈杂环境。其应用场景覆盖多语言通话、会议、线上课程、直播广播等,能够提供实时口译服务。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ONQbG65Q-X2za0bHjX81qdmg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券