语音消息转文本热词

最近更新时间:2024-10-15 14:45:41

我的收藏
为方便开发者快速实现语音消息转文本热词模型(以下用热词指代)功能,本文为您介绍语音消息转文本热词的使用场景以及接入流程。

使用场景

在 GME 转文本的服务中,对一些特有的人名、产品名、公司名或者某个领域的专有词汇,例如游戏术语开黑、游戏中地名等,可能存在识别准确率不高的情况。对于这些专有词汇,GME 提供了热词模型供用户使用,添加热词可以显著提升专有词汇识别准确率。
说明:
热词模型功能目前仅支持中文识别,支持通过控制台方式进行热词的创建。

前提条件

已开通语音转文本服务:如果使用流式语音转文本服务,需要在控制台开通语音转文本服务;如果需要语音消息服务,需要在控制台额外开通语音消息服务,具体开通详情可参见 服务开通指引
已接入 GME SDK:使用语音消息转文本热词模型功能,至少需要接入流式语音转文本功能,或者接入语音消息功能及转文本功能。GME SDK 的调用和接入请参见 Native SDK 快速接入Unity SDK 快速接入Unreal SDK 快速接入
开通语音消息转文本热词模型功能:请 提交工单 联系 GME 团队申请。
说明:
语音消息转文本功能将产生语音消息服务费用、语音转文本服务费用。详情请参见 计费文档

实现方式:控制台操作

您可以直接在控制台界面操作,操作步骤如下:
1. 创建模型
2. 上线模型
3. 下线模型
4. 更新模型
5. 删除模型
6. 体验效果

步骤1: 创建模型

登录控制台 热词热句管理 页面,在上方选择需要使用语音消息转文本热词模型的应用,单击新建热词模型

可下载热词文件模板,按格式要求填写完成后单击上传热词文件,上传后单击提交即可。


格式要求
模型文本格式要求 UTF-8 或 GBK 编码的 txt 文件,文件最大不超过400KB。
每行仅添加一个热词和对应权重且不能包含标点和特殊字符(热词和权重间用英文符号|隔开),详见下方“模型文本数据示例”。
每个热词表最多可添加128个词,每个词最长10个字,不能超出限制(如有超过限制的需求,请使用 热句模型)。
热词权重取值范围为[1,10]之间的整数,权重越大代表该词被识别出来的概率越大。
模型文本数据示例: 开黑|10 上分|10 上路|9 中路|8 空投|9

步骤2: 上线模型

模型训练完成后,需要上线才能使用,单击上线按钮上线该模型。



步骤3: 下线模型

如需修改模型,需要先将已上线的模型下线。模型下线后,需要重新上线热词才能使用该热词模型进行识别。



步骤4: 更新模型

将原上线的模型下线后,单击更换文件重新上传新模型。



步骤5: 删除模型

单击删除即可删除掉现有模型,热词模型删除后,需要重新上传热词文件。



步骤6: 体验效果

在客户端已接入的流式语音转文本功能或者语音消息转文本功能中体验热词效果。