首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

语音机器人人工录音与TTS语音哪个更好

语音机器人已经盛行几年了,那么既然叫语音机器人,语音是怎么来的呢?

今天其实是来探讨这个问题的。

有三种方式,一种是整套话术全部人工录音,就是每句需要讲给客户听的话,都提前用人工录好录音,上传到系统后台,当客户打来电话咨询或者呼出推销自家产品的时候,客户听到的声音其实是提前录制好的,很多客户听到后根本不知道是机器人在跟他对话。当然交流几句后,肯定还是会被发现的,毕竟这不是真人。

第二种,全部用TTS(一项语音合成技术)。为什么会要用合成技术呢,肯定是因为无法用录音来完成这个工作任务。比如催收,就拿电费催缴这个业务场景来说吧,郭某某,欠费10元;李某某,欠费8元;王某某,欠费11元;......这怎么录音呢?一套催缴话术,其他都是固定的说辞,就名字和金额不同。这种不同的元素,我们给他取名叫“变量”。那么这种含有变量的话术,可以全部采用TTS的方式,因为TTS技术能将任意文字信息实时转化为标准流畅的语音朗读出来,就相当于给机器装上了人工嘴巴。

这种场景可能有的人会觉得太机械了,声音全部都是机器转换的,没有一点人情味,没有一点温度,不爱听。有的人觉得这个就是通知我一个事情,并且也是我生活中需要关注的事情,声音什么样子不重要,重要的是内容。

第三种,真人录音混合TTS。还是电费催缴这个场景,既然只有人名和金额是变量,其他都是固定不变的。那么是不是可以固定的部分用真人录音,变量的部分就用TTS来转换呢?

第三种模式天天讯通的AI机器人最早是支持的,但是现在最新的版本已经舍弃了。以后是否还需要继续兼容第三种模式,还在市场验证的过程中。

为什么要舍弃呢?

一个是真人录音与变量这个衔接一般会有延时,让接听电话的人听起来不连贯,感受不太好。还有一个是TTS厂家的收费模式,他们是按次收费。举例说明,比如郭某某,您好!截止到今天您的电费已欠款50元,请及时缴纳,避免停电!其中郭某某和50是两个变量,如果我们整句话一起转换,不但连贯性没问题,还只算一次转换费用。如果固定部分用真人录音,变量部分转换,那么两个变量算两次转换费。

所以评估出来,干脆这种模式就先舍弃了,既能节约我们机器的性能,又能让语音连贯性更好,还省成本。也欢迎大家给出意见或者建议,看看我们是否还需要恢复这个模式。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OZK3XMv6mYNsotv0ObbtEJ5g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券