8分钟
1.1.2 任务分类
语音识别的任务可以根据如下的一些维度来分类:
- 词汇量(vocabulary)大小 分为小词汇量(small vocabulary)和大词汇量(large vocabulary)的语音识别。
- 说话人(Speaker) 分为说话人相关(Speaker dependent)和说话人无关(Speaker independent)语音识别系统。
- 声学(Acoustic)环境 录音室 vs 不同程度的噪音环境。
- 说话方式(style) 连续(continously)说话还是一个词一个词(isolated words)的说话;计划(plan)好的还是spontaneous的——”呃,这个东西,不,那个是啥?”
这些维度的组合就决定了不同任务的难度,比如最早的语音识别系统只能识别孤立词(词之间有停顿,因此很容易切分),而且词汇量很小(比如只能识别0-9之间的数字)。而现在的语音识别系统能够在噪声环境识别大词汇量的任务,而且说话人的方式是连续的,它可以处理不同说话人的差异甚至可以处理非标准的发音(比如带口音的普通话)。
学员评价