语音识别简介

语音识别（Automatic Speech Recognition，ASR）为开发者提供语音转文字服务的最佳体验，开放实时语音识别、一句话识别和录音文件识别三种服务形式，满足不同类型开发者需求，具备识别准确率高、接入便捷、性能稳定等特点。
本章节介绍的语音识别 API 接口为 API 2.0/3.0 接口。
您可以调用 API 对语音识别进行操作，例如创建录音文件识别请求、创建热词表等。
语音识别支持的所有接口信息，请参见 API 概览。

术语表

语音识别 API 接口的常见术语请参见下表：

术语	描述
热词	腾讯云语音识别服务对于常用词汇的识别效果极佳，但对一些特有的人名、产品名、公司名或者某个领域的专有词汇，例如：品牌名智聆、建筑名滨海大厦、保险领域专业词汇核保、云存储专业词汇存储桶等，可能存在识别准确率降低的情况。对于这些专有词汇，腾讯云语音识别提供了热词功能供用户使用，添加热词可以显著提升通用引擎在这类专有词汇上的识别准确率。
自学习模型	腾讯云目前提供的通用领域语音识别服务，能够在大部分场景下实现较好的识别效果。对于专业名词、特殊表达较多的应用场景，我们提供了自学习定制模型帮助用户自助提升专有领域的识别效果。如果用户在专有领域或行业积累了丰富的文本数据，可以用自学习定制模型进行定向优化，从而有效提高语音识别准确率。
替换词	腾讯云语音识别服务对于常用词汇的识别效果极佳，但对一些特有的人名、产品名、公司名等专有词汇或者敏感词，可能存在识别准确率降低的情况。如果配置了热词后，仍然效果不好，腾讯云语音识别提供了替换词功能。添加替换词可以显著提升通用引擎在这类专有词汇上的识别准确率。

使用限制

对于 API 接口的参数限制，请参考各接口文档中的参数说明。

API 快速入门

您可以使用 API Explorer 工具在线调用 API。
本文以录音文件识别请求为例，通过 API Explorer 工具调用 API 接口的步骤如下：
1.进入 API Explorer 页面。更多 API Explorer 工具使用信息，请参见使用 API Explorer 。
2.调用 CreateAsyncRecognitionTask 接口，创建录音文件识别请求。
3.创建录音文件识别请求后，通过接口返回拿到结果查询需要的 TaskId 。至此，录音文件识别请求创建完成。

简介

本页目录：

术语表

使用限制

API 快速入门