词汇表

最近更新时间:2024-11-11 17:25:53

我的收藏

A

API

参见 应用程序编程接口

ASR

语音识别技术(ASR),也被称为自动语音识别(Automatic Speech Recognition),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与“说话人识别”及“说话人确认”不同,后者尝试识别/确认的对象是发出语音的人而非语音中所包含的词汇、句子等内容。

C

采样位数

采样位数即将采样样本振幅量化。并支持待识别音频的采样位数为16Bit。

L

鲁棒性

鲁棒性指的是系统在面对各种不同的情况下,能够保持较高的性能和稳定性。在计算机科学和工程中,鲁棒性通常用于描述系统在面对各种异常、不确定性或异常条件时的表现能力。而语音识别的鲁棒性指的是识别系统在面对不同的输入条件时仍能保持较高的准确性和稳定性。这些输入条件可能包括说话者的口音、说话速度、环境噪声、语音质量等因素。

Q

QPS/并发

  • QPS/并发指每秒请求的并发数,1QPS 即每秒同时支持请求接口1次,50QPS 即每秒同时支持请求接口50次。
  • 在大模型知识引擎中,在同一时间内,有多少用户或设备可以访问和使用某个服务或应用。简单来说,并发就是同时在线的人数或设备数量。
  • 在大模型图像创作引擎/大模型视频创作引擎/腾讯混元大模型中,并发是指能同时处理的任务数量,例如接口默认提供1个并发,代表最多能同时处理 1个已提交的任务,上一个任务处理完毕后才能开始处理下一个任务;QPS 是指每秒提交请求的数量,例如 1QPS 代表每秒最多可支持请求接口1次。

S

SDK

  • SDK(Software Development Kit)是软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。
  • 在搜狗输入法企业版中,输入法为金融政务一体机可提供两种形式版本,一种是安装包,双击直接安装即可;另一种为输入SDK,SDK提供多种接口,企业可根据自己的输入需求,通过输入法接口,在不同的输入位置主动调起不同的键盘窗口。例如:在金融领域终端设备,需要输入名字的位置,可根据输入法提供的接口,默认调起拼音键盘,在需要输入密码的位置,可通过SDK所提供的接口,默认调起数字键盘。

T

通道数

通道数指声音的通道数目,常有单声道和立体声(双声道)。我们的一句话语音识别服务和实时语音识别服务暂时只支持单声道音频识别,录音文件识别既支持单声道音频,也支持立体声音频识别。

Y

应用程序编程接口

应用程序编程接口(Application Programming Interface,API)指软件系统提供给应用程序调用的代码。
开发人员可以通过调用一组功能接口,而无需考虑底层源代码或理解内部工作机制。
API 包含 Windows API 和 Linux API。