近日,搜狗输入法在语音输入领域率先推出“个性化语音识别”功能,突破语音识别技术瓶颈,大幅优化个人词汇录入的直接准确性,在语音输入领域实现“更懂用户”。
搜狗“个性化语音识别”打造用户专属输入法
在日常交流中,个人口头禅、惯用语经常会干扰双方的信息传达,这一问题在人机语音交互中尤为凸显。在语音输入时,往往用户只是想录入一个名称,输入结果却显示的是音同意不同的另一项结果。除此之外,用户习惯使用的个人词汇,以及一些多音字、读音差错也会对语音识别结果造成影响。
基于以上原因,搜狗语音率先对语音识别技术进行了革新优化,推出“个性化语音识别”服务。经过本轮更新,用户只需在搜狗输入法App选择一键登录个人账户,即可体验此项服务。成功开启后,“个性化语音识别”会通过强化学习用户习惯使用的个人词汇,为每个用户建立定制化语音输入法。
搜狗语音又诞生“黑科技”语音识别更精准
搜狗“个性化语音识别”不仅可有效提升用户个性化词句的识别准确率,同时全自动词库学习这一特色极大保证了系统的处理及反馈速度,实现整个学习个性化特征的过程在“毫秒级别”就可以全部自动完成。
通过DTSS(Deep Transformer-based Sequence to Sequence model)的端到端声学模型、神经网络语言模型和智能标点预测等技术,搜狗输入法引入前沿深度学习技术,对语音识别进行仿真模拟和训练,有效提高语音录入在通用场景下的识别准确性,精准度已达到领先业内。“个性化语音识别”可基于用户数据分析,对用户习惯使用的个性化词组进行扫描记录,在语音输入时,优先选择用户习惯用语进行文本输出。
手和舌头是人类最灵活的两个部分,从移动智能设备发展以来,各种触控交互无不依赖于手的操作。而当语音技术和人工智能同时走向成熟时,或许就像《2019语音技术报告》中所描述的那样:语音交互扭转了以往人机交互的存在形态。
新时代即将来临,为应对人工智能、虚拟现实等技术的革新以及不同维度、多场景使用的需要,用户输入法的使用习惯逐渐向语音输入转移。同时,与文本输入相比,语音输入注定成为最主要的人机互动接口。
随着语音识别技术的不断成熟,以及用户个性化词库的不断丰富,搜狗将聚合用户级语音个性化资源,实现“定制化语音输入法”。使每个用户基于“定制版”、“更懂自己”的搜狗语音识别的支持,在日常生活以及医疗、法律等专业领域,有效提高线上交流和人机沟通的效率及准确度,或将成为人工智能时代输入端的全局掌控者。
领取专属 10元无门槛券
私享最新 技术干货