开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

语音识别系统代码

是指用于实现语音识别功能的程序代码。语音识别是一种将人类语音转换为文本或命令的技术，它在许多领域都有广泛的应用，包括语音助手、语音搜索、语音翻译、语音控制等。

语音识别系统代码通常包括以下几个主要组成部分：

音频采集和预处理：通过麦克风或其他音频设备采集用户的语音输入，并对音频进行预处理，如降噪、音频增益调整等。
特征提取：将预处理后的音频转换为特征向量，常用的特征提取方法包括梅尔频率倒谱系数（MFCC）、线性预测编码（LPC）等。
声学模型训练：使用大量标注好的语音数据，通过机器学习算法训练声学模型，常用的算法包括隐马尔可夫模型（HMM）、深度神经网络（DNN）等。
语言模型训练：使用大量文本数据，通过统计语言模型训练语言模型，常用的算法包括n-gram模型、循环神经网络语言模型（RNNLM）等。
解码和后处理：将特征向量输入声学模型和语言模型，使用解码算法得到最可能的文本输出，并进行后处理，如拼音纠错、语法纠错等。

在实际开发中，可以使用各种编程语言来实现语音识别系统代码，常见的编程语言包括Python、Java、C++等。此外，还可以利用一些开源的语音识别引擎和库来加速开发，如CMU Sphinx、Kaldi等。

腾讯云提供了一系列与语音识别相关的产品和服务，包括语音识别API、语音识别SDK、语音转写等。您可以通过腾讯云语音识别产品官方文档（https://cloud.tencent.com/document/product/1093）了解更多详细信息和使用方法。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

智能语音机器人小知识（3）--什么是语音识别技术？

语音识别技术，也被称为自动语音识别Automatic Speech Recognition (ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

04

语音识别系统的分类、基本构成与常用训练方法 | Machine Speech

对于想进入语音识别领域的学习者来说，了解语音识别系统的一些基本概念，会有助于更快的进入这个行业的交流平台，本文对语音识别系统的一些常见概念做了整理，希望能对刚开始接触语音学习的人有所帮助。

03

听懂未来：AI语音识别技术的进步与实战

在人工智能的辉煌进程中，语音识别技术无疑占据了一个至关重要的地位。从最初的简单命令识别到今日能理解复杂语境的智能助手，语音识别技术已经深入人类生活的各个角落。它不仅改变了我们与机器交流的方式，更开启了一个全新的互动时代。

01

绝佳的ASR学习方案：这是一套开源的中文语音识别系统

ASRT 是一套基于深度学习实现的语音识别系统，全称为 Auto Speech Recognition Tool，由 AI 柠檬博主开发并在 GitHub 上开源（GPL 3.0 协议）。本项目声学模型通过采用卷积神经网络（CNN）和连接性时序分类（CTC）方法，使用大量中文语音数据集进行训练，将声音转录为中文拼音，并通过语言模型，将拼音序列转换为中文文本。基于该模型，作者在 Windows 平台上实现了一个基于 ASRT 的语音识别应用软件它同样也在 GitHub 上开源了。

04

深度探索：使用Python与TensorFlow打造端到端语音识别系统

随着自然语言处理技术的飞速发展，语音识别作为一种重要的交互方式日益普及。本文将以使用Python与TensorFlow框架构建端到端语音识别系统为核心，深入探讨关键技术、实现步骤以及代码示例，帮助读者理解并实践语音识别系统的开发。

01

算法基础（6）| 语音识别DTW算法小讲

时至今日，语音识别已经有了突破性进展。2017年8月20日,微软语音识别系统错误率由5.9%降低到5.1%，可达到专业速记员的水平；国内语音识别行业的佼佼者科大讯飞的语音听写准确率则达到了95%，表现强悍。国内诸如阿里、百度、腾讯等大公司，也纷纷发力语音识别，前景一片看好。

01

语音识别全面进入CNN时代：会读“语谱图”的全新语音识别框架

近年来，人工智能和人类生活越来越息息相关，人们一直憧憬身边可以出现一个真正的贾维斯，希望有一天计算机真的可以像人一样能听会说，能理解会思考。而实现这一目标的重要前提是计算机能够准确无误的听懂人类的话语，也就是说高度准确的语音识别系统是必不可少的。作为国内智能语音与人工智能产业的领导者，科大讯飞公司一直引领中文语音识别技术不断进步。去年12月21日，在北京国家会议中心召开的以“AI复始，万物更新”为主题的年度发布会上，科大讯飞提出了以前馈型序列记忆网络(FSMN, Feed-forward Sequenti

05

动态 | 百度发布 Deep Speech 3，不同应用场景下轻松部署高精度语音识别模型

AI 科技评论按：美国时间10月31日，百度研究院发出博文，宣布发布新一代深度语音识别系统 Deep Speech 3。继2014首秀的第一代Deep Speech和被MIT科技评论评为“2016年十

08

使用Python实现语音识别与处理模型

语音识别与处理是一项重要的人工智能技术，它可以将人类语音转换成文本形式，从而实现语音命令识别、语音转写等功能。在本文中，我们将介绍语音识别与处理的基本原理和常见的实现方法，并使用Python来实现这些模型。

01

浅析听不见的海豚音攻击（DolphinAttack）行为

对攻击语音识别系统的研究表明，某些隐藏的语音命令人类无法听见，但是这些声音却可以控制系统。在最近的一些实验中，研究者设计了一个完全听不见的攻击：DolphinAttack，通过将人声负载在高频载波上，可以通过Siri使iPhone发起FaceTime通话。

04

语音识别技术里程碑：微软识别错误率降至5.1%

8月21日，微软宣布该公司的语音识别系统的错误率已经降至5.1%，这是目前为止错误率最低的，已经超过了去年由微软AI研究团队所创造的5.9%的成绩。这两项研究都转录了总机语料库的录音，这是一个从20世纪90年代初就开始被研究人员用来测试语音识别系统的2400个电话对话的集合，这项新研究是由微软AI研究团队完成的，旨在让AI的语音识别达到与人类相同的准确度。总的来说，最新研究的研究人员通过改进微软语音识别系统的基于神经网络的声学与语言模型，将错误率降低了12%左右，值得一提的是，他们还使语音识别器能够

06

语音识别 | Java 实现 AI 人工智能技术 - 语音识别功能

说到语音识别、语音翻译、图像识别、人脸识别等等，现在已经非常非常非常普及了，看过‘最强大脑’的朋友，也应该对‘小度’这个机器人有所了解，战胜国际顶尖的‘大脑’- 水哥，(PS：内幕不知)，那么今天，我们来看下关于语音识别，是如何做到的，Java又是如何识别语音的？如何转换语音？

06

[机器学习|理论&实践] 强化学习在语音识别技术的演变与部署

语音识别技术的演进一直受益于不断发展的机器学习算法，其中强化学习作为一种强大的学习范式，逐渐在语音识别领域崭露头角。本文将深入研究强化学习在语音识别中的演变过程，结合实例详细探讨其部署过程，包括数据处理、模型训练与部署等方面。

01

智能语音相关介绍

语音是指人类通过发音系统，包括肺部、气管、喉部声门和声带、咽腔、口腔、鼻腔等，发出的在空气中传播的、具有一定意义的声音，是语言的声音形式，是人人交流中最主要的信息载体。另外，通过让机器能听会说，语音也成为人机交互的重要入口。

01

语音识别的相关知识

语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。　语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用，例如在翼卡车联网中，只需按一键通客服人员口述即可设置目的地直接导航，安全、便捷。

01

无监督学习站起来了！Facebook第三代语音识别wav2vec-U，匹敌监督模型，Lecun看了都说好

---- 新智元报道来源：Facebook AI 编辑：LRS 【新智元导读】Facebook在语音识别上又出重磅新作，继wav2vec, wav2vec 2.0以来，又出完全不需要监督数据的wav2vec-U，小众语言也能用语音识别啦！相比显示器、鼠标、键盘这些传统的人机交互方式以外，随着语音识别技术的逐渐成熟，和电子产品进行「对话」也逐渐成为一种稀松平常的人机交互。无论是给计算机或其他设备下达指示，还是回答用户的问题，语音识别在各个方面让电子产品的使用变得更加容易，无需学习，想要干什么只

01

最强CNN语音识别算法开源了：词错率5%，训练超快，Facebook出品

抛开广告法不谈，我们来全面了解一下wav2letter++，看看Facebook哪来的勇气口出狂言。

02

专访微软研究院俞栋：基于深度学习的语音识别及CNTK的演进

作为人工智能领域的一个重要方向，语音识别近年来在深度学习（Deep Learning）的推动下取得了重大的突破，为人机语音交互应用的开发奠定了技术基础。语音识别技术演进及实现方法、效果，既是语音识别从业者需要系统掌握的知识，也是智能化应用开发者应当了解的内容。日前，微软研究院首席研究员、《解析深度学习-语音识别实践》第一作者俞栋接受CSDN专访，深入解析了基于深度学习的语音识别的最新技术方向，和微软团队的实践心得，并对微软开源的深度学习工具CNTK的迭代思路做了介绍。俞栋介绍了deep CNN、LFMMI

05

业界 | 谷歌用新的语音数据扩增技术大幅提升语音识别准确率

AI 科技评论按：把一段输入音频转换为一段文本的任务「自动语音识别（ASR）」，是深度神经网络的流行带来了极大变革的人工智能任务之一。如今常用的手机语音输入、YouTube 自动字幕生成、智能家电的语音控制都受益于自动语音识别技术的发展。不过，开发基于深度学习的语音识别系统还不是一个已经完善解决的问题，其中一方面的难点在于，含有大量参数的语音识别系统很容易过拟合到训练数据上，当训练不够充分时就无法很好地泛化到从未见过的数据。

01

GitHub 3.1K，业界首个流式语音合成系统开源！

智能语音技术已经在生活中随处可见，常见的智能应用助手、语音播报、近年来火热的虚拟数字人，这些都有着智能语音技术的身影。智能语音是由语音识别，语音合成，自然语言处理等诸多技术组成的综合型技术，对开发者要求高，一直是企业应用的难点。

01

业界 | 谷歌用新的语音数据扩增技术大幅提升语音识别准确率

AI 科技评论按：把一段输入音频转换为一段文本的任务「自动语音识别（ASR）」，是深度神经网络的流行带来了极大变革的人工智能任务之一。如今常用的手机语音输入、YouTube 自动字幕生成、智能家电的语音控制都受益于自动语音识别技术的发展。不过，开发基于深度学习的语音识别系统还不是一个已经完善解决的问题，其中一方面的难点在于，含有大量参数的语音识别系统很容易过拟合到训练数据上，当训练不够充分时就无法很好地泛化到从未见过的数据。

03

语音识别基础学习与录音笔实时转写测试

小编所在项目中，C1、C1Pro、C1Max录音笔，通过BLE和APP连接，音频文件实时传输到录音助手App端，具备实时录音转写的功能。工欲善其事必先利其器，小编补习了语音识别相关基础知识，对所测试应用的实时转写业务逻辑有了更深的认识。希望对语音测试的小伙伴们也有所帮助~~(●—●)

02

语音识别技术的发展与未来趋势：深度学习、端到端建模与多模态融合

语音识别（Speech Recognition）技术是指将口述或语音信号转化为文本或命令的自动化过程。随着深度学习技术的快速发展，语音识别取得了长足的进步，成为人机交互、智能助理和语音控制等领域的核心技术之一。本文将详细介绍语音识别技术的发展历程，重点介绍了深度学习、端到端建模以及多模态融合等技术在语音识别领域的应用，并展望了未来的发展趋势。

05

AI 看唇语，在嘈杂场景的语音识别准确率高达75%

事实上，研究表明视觉线索在语言学习中起着关键的作用。相比之下，人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练，通常需要数万小时的记录。

03

谷歌双语助理来了！中英夹杂也不怕，递归神经网络和随机森林显神威

多语家庭正变得越来越普遍，有一些研究发现多语人口已经超过单语人口，而且这个数字还将继续增长。随着多语用户数量的不断增加，开发能够同时支持多种语言的产品比以往任何时候都更加重要。

02

谷歌公司开发出高速、离线语音识别技术

据科技资讯网站zdnet（www.zdnet.com）报道，谷歌开发出了可在未联网的Nexus 5智能手机上实时运行的语音识别系统。该系统无需通过远程数据中心进行运算，所以在没有可靠网络的情况下亦可通过智能手机、智能手表或其他内存有限的电子设备使用语音识别功能。谷歌的科研人员表示，研发该系统的目的是创建在本地运行的轻量级、嵌入式、准确度高的语音识别系统。轻量级是指这套系统仅20.3MB，而在搭载2.26GHz CPU和2GB内存的Nexus 5上测试时，系统在开放式听写任务中的错误率仅为13.5%。当然

05

【微软语音识别新突破，错误率降至5.1%】黄学东：新的行业里程碑

【新智元导读】微软语音识别系统取得最新突破：微软的语音对话研究小组在Switchboard语音识别任务中，将错误率从去年的 5.9% 再一次降低到 5.1%，达到目前最先进水平。去年，微软的语音与对话研究小组宣布在Switchboard 对话语音识别任务上达到人类水平，实现里程碑式的突破。微软技术Fellow黄学东在微软官方博客上称，这意味着，他们创造了一种技术，可以在对话中识别词语，且与人类专业的速记员水平相当。黄学东在博客上说：“在我们的转录系统达到5.9％的错误率之后，其他研究人员进行了自己的研

05

wav2letter++：基于卷积神经网络的新一代语音识别框架

虽然基于RNN的技术已经在语音识别任务中得到验证，但训练RNN网络需要的大量数据和计算能力。最近，Facebook的AI研究中心（FAIR）发表的一个研究论文，提出了一种新的单纯基于卷积神经网络（Convolutional Neural Network）的语音识别技术，而且提供了开源的实现wav2letter++，一个完全基于卷积模型的高性能的语音识别工具箱。

01

AI 看唇语，在嘈杂场景的语音识别准确率高达75%

编译 | 禾木木出品 | AI科技大本营（ID:rgznai100）人们通过聆听和观察说话者的嘴唇动作来感知言语。那么，AI 也可以吗？事实上，研究表明视觉线索在语言学习中起着关键的作用。相比之下，人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练，通常需要数万小时的记录。为了研究视觉效果，尤其是嘴部动作的镜头，是否可以提高语音识别系统的性能。Meta 的研究人员开发了 Audio-Visual Hidden Unit BERT (AV-HuBERT)，这是一个通过观看学习和听人们说

01

现在的语音识别技术可能存在的问题

以下内容来自于Sensory网站，作者为Sensory CEO Todd Mozer -

04

高通称其终端语音识别准确率达95%

高通公司人工智能研究人员表示，该公司正在研制用于智能终端的语音识别系统，通过综合采用循环神经网络和卷积神经网络，该系统语音识别准确率可达95%。

01

独家 | 一文读懂语音识别（附学习资源）

一、前言 6月27日，美国权威科技杂志《MIT科技评论》公布2017全球最聪明50家公司榜单。科大讯飞名列中国第一、全球第六。全世界排在科大讯飞前面企业分别是：英伟达、Spacex、亚马逊、23andme、Alphabet。《MIT科技评论》认为，“科大讯飞旗下的语音助手是中国版的Siri，其可携带实时翻译器则是一款杰出的人工智能应用，克服了方言、俚语和背景杂音，可将汉语精准地翻译成十几种语言。科大讯飞在中国语音技术市场的占有率70%。”越来越多的人认为，语音识别将成为下一代交互革命的关键技术。与此

06

机器学习原来如此有趣：如何用深度学习进行语音识别

语音识别正在「入侵」我们的生活。我们的手机、游戏主机和智能手表都内置了语音识别。他甚至在自动化我们的房子。只需50美元，你就可以买到一个Amazon Echo Dot，这是一个可以让你订外卖、收听天气

使用人工神经网络和人工蜂群优化进行语音识别

在过去的十年左右的时间里，机器学习的进步为开发越来越先进的语音识别工具铺平了道路。通过分析人类语音的音频文件，这些工具可以学习识别不同语言的单词和短语，并将其转换为机器可读格式。

04

深度全序列卷积神经网络克服LSTM缺陷，成功用于语音转写

【新智元导读】目前最好的语音识别系统采用双向长短时记忆网络（LSTM，LongShort Term Memory），但是，这一系统存在训练复杂度高、解码时延高的问题，尤其在工业界的实时识别系统中很难应用。科大讯飞在今年提出了一种全新的语音识别框架——深度全序列卷积神经网络（DFCNN，Deep Fully Convolutional NeuralNetwork），更适合工业应用。本文是对科大讯飞使用DFCNN应用于语音转写技术的详细解读，其外还包含了语音转写中口语化和篇章级语言模型处理、噪声和远场识别和文本

05

业界｜科大讯飞语音识别框架最新进展——深度全序列卷积神经网络登场

导读：目前最好的语音识别系统采用双向长短时记忆网络（LSTM，LongShort Term Memory），但是，这一系统存在训练复杂度高、解码时延高的问题，尤其在工业界的实时识别系统中很难应用。科大讯飞在今年提出了一种全新的语音识别框架——深度全序列卷积神经网络（DFCNN，Deep Fully Convolutional NeuralNetwork），更适合工业应用。本文是对科大讯飞使用DFCNN应用于语音转写技术的详细解读，其外还包含了语音转写中口语化和篇章级语言模型处理、噪声和远场识别和文本处理实时

05

AI时代，FreeSWITCH能做什么？

那么，智能时代跟FreeSWITCH什么关系呢？严格来说，其实没什么关系。你看，我今天又标题党了。

01

GitHub 3.1K，业界首个流式语音合成系统开源！

智能语音技术已经在生活中随处可见，常见的智能应用助手、语音播报、近年来火热的虚拟数字人，这些都有着智能语音技术的身影。智能语音是由语音识别，语音合成，自然语言处理等诸多技术组成的综合型技术，对开发者要求高，一直是企业应用的难点。飞桨语音模型库 PaddleSpeech ，为开发者提供了语音识别、语音合成、声纹识别、声音分类等多种语音处理能力，代码全部开源，各类服务一键部署，并附带保姆级教学文档，让开发者轻松搞定产业级应用！ PaddleSpeech 自开源以来，就受到了开发者们的广泛关注，关注度持续上涨。

02

能听懂口音的开源语音系统来了：OpenAI出品，支持99种语言，英文识别能力直逼人类

羿阁发自凹非寺量子位 | 公众号 QbitAI 逼近人类水平的语音识别系统来了？没错，OpenAI新开源了一个名为「Whisper」的新语音识别系统，据称在英文语音识别方面拥有接近人类水平的鲁棒性和准确性！不仅如此，对于不同口音、专业术语的识别效果也是杠杠的！一经发布就在推特上收获4800+点赞，1000+转发。网友们纷纷对它意料之外的强大功能表示惊讶。不仅是英文，有人用法国诗人波德莱尔的《恶之花》进行了语音测试，得到的文本几乎与原文一致。 OpenAI联合创始人&首席科学家Ilya S

05

深度 | IBM语音识别能力逼近人类水平，获深度学习巨头Yoshua Bengio盛赞

你知道吗？人类每听20个词，其实就有一两个成为“漏网之鱼”。而在一段五分钟的对话中，这一数字达到了80。但对于我们而言，少听一两个词并不会影响我们对语意的理解，然而想象一下，计算机如果要完成这件事有多难？去年，IBM已经在语音识别领域走到了一个新的里程碑：系统的错误率降低为6.9%；而AI科技评论了解到，近日IBM Watson的语音识别系统将这个数字降到了5.5%。清华大学的邓志东教授此前在采访中向AI科技评论表示，只有AI技术达到人类水平，它才有商业化的可能性。技术越来越接近人类水平也一直是人工

06

GitHub 3.1K，业界首个流式语音合成系统开源！

大家好，我是崔庆才。想必大家在开发项目过程中可能或多或少用到语音识别、语音合成等相关技术，但又不知道哪家的服务好，而且有的收费还贼贵。尤其流式识别更是个难题。今天我给大家推荐一个流式语音合成库，现在在 GitHub 上已经开源，而且已经斩获 3.1k star，效果很不错，同时这也是业界首个流式语音合成系统，推荐给大家试试。具体详情大家可以了解下文哈，最后还有直播课，大家感兴趣欢迎扫码了解。智能语音技术已经在生活中随处可见，常见的智能应用助手、语音播报、近年来火热的虚拟数字人，这些都有着智能语音技术

01

Google又逆天：语音输入离线实时输出文字，仅占80MB！然而……

这次出手的，又是谷歌 AI 团队。刚刚，他们为旗下的一款手机输入法 Gboard （不要跟谷歌拼音输入法搞混了啊~）上线了新功能：离线语音识别。目前这一新功能，只能在其自家的产品 Pixel 系列手机上使用。

02

碟中谍再现，新研究攻破基于音频的生物识别系统 | 一周AI最火论文

呜啦啦啦啦啦啦啦大家好，连续两周拖更的AIScholar Weekly栏目又和大家见面啦！

06

信号为E时，如何让语音识别脱“网”而出？

可以说，语音识别是人类征服人工智能的前沿阵地，是目前机器翻译、自然语言理解、人机交互等的奠基石。

04

学界 | 图像识别攻击还没完全解决，语音识别攻击又来了！

AI 科技评论按：当前的语音识别技术发展良好，各大公司的语音识别率也到了非常高的水平。语音识别技术落地场景也很多，比如智能音箱，还有近期的谷歌 IO 大会上爆红的会打电话的 Google 助手等。本文章的重点是如何使用对抗性攻击来攻击语音识别系统。本文发表在 The Gradient 上，AI科技评论将全文翻译如下。

02

干货 | Siri 语音识别的小心机：你在哪里，就能更准确地识别那附近的地址

AI 科技评论按：这篇文章来自苹果机器学习日记（Apple Machine Learning Journal）。与其他科技巨头人工智能实验室博客的论文解读、技术成果分享不同，苹果的机器学习日记虽然也是介绍他们对机器学习相关技术的心得体会，但侧重点在于技术产品的实现过程、技术资源用户体验之间的取舍，更像是「产品经理的 AI app 研发日记」。过往内容可以参见如何设计能在Apple Watch上实时运行的中文手写识别系统，苹果揭秘「Hey Siri」的开发细节，为了让iPhone实时运行人脸检测算法，苹果原来做了这么多努力。

02

语音识别训练时间由7天降至11.5小时，IBM提出分布式深度学习技术

可靠、稳健、可泛化的语音识别是机器学习领域一个持续的挑战。通常，训练自然语言理解模型需要包含数千小时语音和数百万（甚至数十亿）单词文本的语料库，以及能够在合理时间内处理这些数据的强大硬件。

03

[语音识别] 05 基于GMM-HMM的语音识别系统（单音素、三音素）

基于GMM-HMM的语音识别系统开源的语音识别工具包 http://kaldi-asr.org/ 作者: http://www.danielpovey.com/ 为什么用Kaldi?

00

语音对话机器人，百行Python代码就能轻松实现

siri是由苹果开发的人工智能系统,很多人在无聊的时候就喜欢调戏siri,不过反倒被siri给调戏了。

02

Linux下利用python实现语音识别详细教程

语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单词的词汇量。现代语音识别系统已经取得了很大进步，可以识别多个讲话者，并且拥有识别多种语言的庞大词汇表。语音识别的首要部分当然是语音。通过麦克风，语音便从物理声音被转换为电信号，然后通过模数转换器转换为数据。一旦被数字化，就可适用若干种模型，将音频转录为文本。大多数现代语音识别系统都依赖于隐马尔可夫模型（HMM）。其工作原理为：语音信号在非常短的时间尺度上（比如 10 毫秒）可被近似为静止过程，即一个其统计特性不随时间变化的过程。许多现代语音识别系统会在 HMM 识别之前使用神经网络，通过特征变换和降维的技术来简化语音信号。也可以使用语音活动检测器（VAD）将音频信号减少到可能仅包含语音的部分。幸运的是，对于 Python 使用者而言，一些语音识别服务可通过 API 在线使用，且其中大部分也提供了 Python SDK。

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭