首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >目前国内的语音识别技术达到了什么水准?还存在哪些问题?

目前国内的语音识别技术达到了什么水准?还存在哪些问题?

提问于 2018-08-05 21:42:13
回答 7关注 0查看 2.3K

现在技术越来越厉害了,前几年还感觉语音打字特别不靠谱,各种语音助手也相当蠢萌,想问下现在国内语音识别发展到什么水平了?

实时且准确的将语音转化成相对应的文本已经达到了什么样的水准?主要还存在哪些方面的问题?

回答 7

小贝

发布于 2018-08-06 05:42:02

目前语音识别技术已经发展得很好了,最高的准确率差不多能够达到95%。

应用场景也很多,比如说:

1、语音输入法:为用户节省输入时间、提升输入体验。

2、语音消息转写:将用户的语音信息转成文字信息,提升用户阅读效率。

3、智慧会场:将会议、庭审、采访等场景的音频信息转换为文字,降低人工记录成本、提升效率。

4、字幕生成:将直播和录播视频中的语音换成成文字,轻松便捷地生成字幕文件。

5、电话质检:通过语音识别服务将坐席通话转成文字,全面覆盖质检内容、提升质检效率。

6、安全监控:对直播音频流进行黄反暴力等关键词检索,大幅度提升敏感信息的监控能力。

7、语音助手:让智能硬件听清用户表达,实现对话式人机交互的第一步。

包括实时语音识别、一句话识别和录音文件识别服务,满足不同类型开发者需求。

当然还有一些待解决的问题,比如说:一些与普通话相差甚远的南方方言很难识别,噪音太过强烈的语音很难识别,等等。

okchina

发布于 2018-08-06 06:33:23

在实际生活中并没有说的误差率仅有3%那么牛逼吧。

比如嘈杂环境或带口音的方言都很大程度影响着语音识别的准确度。

更不用说中文这么复杂,同一个发音的词会很多不同的意义,提高语音识别的精度还是有很大难度的。

按照目前的技术水平来看,随着麦克风阵列等硬件技术的升级,语音数据的收集,语音识别的准确流程还能提升,但也只能无限接近于100%,但绝不可能做到完全准确

嗝屁

发布于 2018-08-06 02:27:18

据我了解,目前国内比较牛的语音识别系统在日常场合已经能达到实用化的水平了。

技术方面,从最初的FNN(前馈全连接神经网络)到RNN(的递归神经网络)。

再到现在应用比较广的LSTM和DFCNN,网络结构越来越复杂,越来越能对语音的特性进行建模,相应的效果也越来越好。

和开发者交流更多问题细节吧,去 写回答
相关文章
现在的语音识别技术可能存在的问题
以下内容来自于Sensory网站,作者为Sensory CEO Todd Mozer -
用户6026865
2020/11/11
1.6K0
智能语音机器人小知识(3)--什么是语音识别技术?
语音识别技术,也被称为自动语音识别Automatic Speech Recognition (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
思谱云汇
2019/05/22
3.9K0
智能语音机器人小知识(3)--什么是语音识别技术?
语音识别技术的相关知识
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
用户5777378
2019/07/08
2.9K0
语音识别技术的相关知识
什么是语音识别的语音助手?
语音助手已经成为现代生活中不可或缺的一部分。人们可以通过语音助手进行各种操作,如查询天气、播放音乐、发送短信等。语音助手的核心技术是语音识别。本文将详细介绍语音识别的语音助手。
网络技术联盟站
2023/05/14
4.5K0
什么是语音识别的语音助手?
什么是语音识别的语音搜索?
随着智能手机、智能音箱等智能设备的普及,语音搜索已经成为了一种趋势。语音搜索不仅方便快捷,而且可以实现双手的解放。语音搜索的实现离不开语音识别技术,本文将详细介绍语音识别的语音搜索。
网络技术联盟站
2023/05/14
4.5K0
什么是语音识别的语音搜索?
人工智能 - 语音识别的技术原理是什么
转自:https://www.zhihu.com/question/20398418/answer/18080841
陈哈哈
2020/07/06
3.1K1
人工智能 - 语音识别的技术原理是什么
React 新的文档用到了哪些技术?
https://beta.reactjs.org React 的新的文档已经 完成了 70 % 并且呼吁社区进行翻译工作。
狂奔滴小马
2022/01/20
1.6K0
React 新的文档用到了哪些技术?
面试题93:什么是CAS?存在哪些问题?
【什么是CAS】 CAS(Compare And Swap),即:对值先进行比较,符合我们的预期之后再进行赋值操作。 CAS是一种基于乐观锁的操作。 在Java中锁是分为乐观锁和悲观锁的。 乐观锁 乐观的认为发生锁冲突的概率很低,所以采取了一种宽泛的态度,通过某种处理方式而不是采用加锁来控制资源共享。在高并发下,优点是性能会比悲观锁高很多,但是实现起来会比悲观锁更复杂。 悲观锁 悲观的认为发生锁冲突的概率很高。所以每当操作共享资源的时候,它都会将资源的使用权锁住,而当操作完毕之后,才释放这个资源的使用权,
爪哇缪斯
2023/05/10
2330
面试题93:什么是CAS?存在哪些问题?
ZLG深度解析——语音识别技术
语言作为人类的一种基本交流方式,在数千年历史中得到持续传承。近年来,语音识别技术的不断成熟,已广泛应用于我们的生活当中。语音识别技术是如何让机器“听懂”人类语言?本文将为大家从语音前端处理、基于统计学语音识别和基于深度学习语音识别等方面阐述语音识别的原理。
刘盼
2019/05/17
2.5K0
ZLG深度解析——语音识别技术
语音识别 | Java 实现 AI 人工智能技术 - 语音识别功能
说到语音识别、语音翻译、图像识别、人脸识别等等,现在已经非常非常非常普及了,看过‘最强大脑’的朋友,也应该对‘小度’这个机器人有所了解,战胜国际顶尖的‘大脑’- 水哥,(PS:内幕不知),那么今天,我们来看下关于语音识别,是如何做到的,Java又是如何识别语音的?如何转换语音?
码神联盟
2018/07/30
8K0
语音识别 |  Java 实现 AI 人工智能技术 - 语音识别功能
语音打断功能——深入语音识别技术,设计语音用户界面(VUI)
语音打断功能常用于交互式语音应答(IVR)系统,从而用户可以随时中断系统。当系统检测到任意语音时,它都会立即停止播放当前的提示并开始收听用户说话,如下面的示例所示。
博文视点Broadview
2020/06/11
5K0
语音打断功能——深入语音识别技术,设计语音用户界面(VUI)
(干货)老大:你为什么要用Mybatis,JDBC存在哪些问题?
通过上面这段再熟悉不过的jdbc代码,可以看到,使用再多的jdbc对数据库做操作的时候,无非就这么几个步骤:
手撕代码八百里
2021/04/20
2820
智能机器人语音识别技术
语音控制的基础就是语音识别技术,可以是特定人或者非特定人的。非特定人的应用更为广泛,对于用户而言不用训练,因此也更加方便。语音识别可以分为孤立词识别,连接词识别,以及大词汇量的连续词识别。对于智能机器人这类嵌入式应用而言,语音可以提供直接可靠的交互方式,语音识别技术的应用价值也就不言而喻。 1 语音识别概述 语音识别技术最早可以追溯到20世纪50年代,是试图使机器能“听懂”人类语音的技术。按照目前主流的研究方法,连续语音识别和孤立词语音识别采用的声学模型一般不同。孤立词语音识别一般采用DTW动态时间规整
机器人网
2018/04/25
6.1K0
智能机器人语音识别技术
百度迁徙用到了哪些技术?
大数据文摘给您拜年啦! 感谢各位读者的陪伴! 您的每一次阅读、分享、留言都是对我们的鼓励和支持。 虽然过年,我们也会为您持续分享,2015的大数据文摘内容将更加丰富、有料、有趣,值得期待!同时,我们也希望有能力、愿分享的你加入文摘,和我们一起创造价值。 今日为您奉上饮食篇,祝大家吃好喝好身体好,新的一年事事顺心。 作者:承哲 作者公众号:shouxifayanzhe 作者微博:http://weibo.com/intper 摘自:虎嗅 最近一朋友问我百度迁徙图到底是怎么弄出来的?而在这过程中发现我原
大数据文摘
2018/05/23
5070
什么是技术债,为什么要还技术债?
先说我的结论就是:技术债要还,还不还技术债,决定你所在的公司是不是尊重科学尊重技术,观点主要有以下三个:
phoenix.xiao
2020/08/06
5680
什么是技术债,为什么要还技术债?
什么是语音识别的智能客服?
随着人工智能技术的不断发展,语音识别技术越来越成熟,语音技术的应用也越来越广泛。智能客服是其中一个应用领域,它通过语音识别技术,将用户的语音输入转换为文本,并通过自然语言处理技术,解决用户的问题。本文将详细介绍语音识别的智能客服。
网络技术联盟站
2023/05/14
9920
什么是语音识别的智能客服?
高通称其终端语音识别准确率达95%
高通公司人工智能研究人员表示,该公司正在研制用于智能终端的语音识别系统,通过综合采用循环神经网络和卷积神经网络,该系统语音识别准确率可达95%。
人工智能快报
2018/07/26
5650
2025年全球语音识别市场将达69亿美元
【概要】市场研究公司Tractica在其一份报告中预测,到2025年全球的语音识别市场将达到69亿美元。
人工智能快报
2018/10/08
4820
从不温不火到炙手可热:语音识别技术简史
【导读】语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到 2009 年深度学习技术的长足发展才使得语音识别的精度大大提高,虽然还无法进行无限制领域、无限制人群的应用,但也在大多数场景中提供了一种便利高效的沟通方式。本篇文章将从技术和产业两个角度来回顾一下语音识别发展的历程和现状,并分析一些未来趋势,希望能帮助更多年轻技术人员了解语音行业,并能产生兴趣投身于这个行业。
AI科技大本营
2019/08/23
1.7K0
从不温不火到炙手可热:语音识别技术简史
点击加载更多

相似问题

语音识别支持哪些语言?

1401

OCR文字识别技术有哪些应用?

83.7K

语音识别Demo的问题?

1635

语音识别的音频格式有哪些?

1195

目前有哪些好玩的语音识别项目?

2778
相关问答用户
腾讯 | 产品运营经理擅长5个领域
腾讯 | 服务生
腾讯 | 客户端研发擅长3个领域
腾讯云AI | 技术专家
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档