Pocketsphinx构建小词汇量模型

Pocketsphinx是一种开源的自动语音识别（ASR）工具，用于构建小词汇量模型。它是Carnegie Mellon University（CMU）的一个项目，用于将语音信号转换为文本。下面是对Pocketsphinx的完善且全面的答案：

概念： Pocketsphinx是一个基于隐马尔可夫模型（HMM）的连续音频流识别器，可将语音输入转换为文本输出。它支持使用自定义的语言模型和声学模型，可以用于开发语音识别应用程序。
分类： Pocketsphinx属于自动语音识别（ASR）领域，可用于构建小词汇量模型。
优势：

开源免费：Pocketsphinx是开源的，免费使用和修改。它提供了灵活性和可扩展性，适用于各种语音识别需求。
轻量级：Pocketsphinx是一个相对轻量级的语音识别引擎，适用于资源受限的设备和应用程序。
高度可定制化：Pocketsphinx允许用户使用自定义的语言模型和声学模型，以满足特定的识别需求。
实时性能：Pocketsphinx能够实时识别连续的音频流，适用于需要快速响应的实时应用程序。

应用场景：

语音助手：Pocketsphinx可用于构建语音助手应用程序，如智能音箱、语音交互系统等。
语音控制：Pocketsphinx可以将语音指令转换为控制命令，用于控制智能家居、无人机、机器人等设备。
字幕生成：Pocketsphinx可以将语音转换为文字，用于实时字幕生成、语音转写等应用。
语音搜索：Pocketsphinx可用于构建语音搜索应用程序，如语音导航、语音翻译等。

推荐的腾讯云相关产品：腾讯云提供了一系列与语音识别和处理相关的产品和服务，可以与Pocketsphinx结合使用，如下所示：

腾讯云语音识别（ASR）：提供基于云的语音转文本服务，可用于快速将语音转换为文本。
腾讯云语音合成（TTS）：提供自然语言合成服务，将文字转换为语音，可以与Pocketsphinx相反的功能。
腾讯云音视频处理（MPS）：提供用于音视频处理的云端服务，包括音频提取、转码、剪辑等功能。

Pocketsphinx项目地址：https://github.com/cmusphinx/pocketsphinx

请注意，本回答仅涵盖Pocketsphinx相关内容，不包括其他云计算品牌商的信息。

页面内容是否对你有帮助？

有帮助

没帮助

Pocketsphinx构建小词汇量模型

、、

我想为口袋狮身人面像(.lm)建立一个小的德语词汇模型，它只能识别从0到9的德语数字。使用Voxforge de-de模型时，性能非常差(几乎无法识别)。我在英语中用类似的方法尝试了TIDIGTS -它使用了一个只包含数字的特殊模型。这个可以正常工作。因此，我显然需要构建一个只包含我的数字的.lm模型-为此，我已经录制了许多wav文件，并将它们转录成所需的XML格式。但是当我查看https://cmusphinx.github.io/wiki/tu

浏览 15提问于2020-01-27得票数 1

1回答

用于jquery移动phonegap应用程序的语音转文本api

、、、、

这款应用程序是一款使用jquery mobile javascript构建的phonegap应用程序。它同时适用于Android和IOS。

浏览 4提问于2013-11-26得票数 1

2回答

linux下的简单语音识别

、

我看到pocketsphinx在软件中心可以作为二进制下载，但是从终端运行它会失败，报告它需要参数，但是我不知道该放什么。我试着安装所有列出的声音模型，但我不知道它们是在哪里保存的，也不知道如何让它们工作。我也不知道如何使Sphinx3工作。Sphinx3手册似乎坏了，而口袋狮身人面像没有一个对我来说有意义的例子用法。我正在寻找的东西，得到60%正确的识别麦克风输入有限的词汇量和单词，然后可以写到一个文本文件-这些东西存在于80年代末。所以，我知道它的存在，并应该以某种方式起作用。(网络连接是不可以的)

浏览 0提问于2013-05-20得票数 17

1回答

在不使用azure等云服务的情况下，在. net core 3.1 web应用程序中实现语音到文本

、、、、

我正在尝试在我的.net核心3.1Web应用程序上实现语音到文本，而不使用任何云服务，如Azure，亚马逊网络服务或谷歌。因此，如果您可以提供如何在.net核心上实现这些apis的简要概述，或者链接到一些文章，这将非常有帮助。

浏览 18提问于2020-12-30得票数 0

1回答

PocketSphinx无输出

我在本教程的基础上构建了语言模型(使用CMUCLMTK)和声学模型。 pocketsphinx_continuous -hmm ... -lm ... -dict ...(我的模型和训练集很小)。我的设备运行良好，因为我在英语模型中测试了pocketSphinx，而且它的性能非常好。，还有什么会导致这种奇怪的结果呢？

浏览 2提问于2012-05-14得票数 1

4回答

如何在iphone中将语音转换为文本？

、

我想建立一个应用程序，当用户在iphone上说话时，它将转换为相应的文本。在iphone中这是可能的吗？有什么API可以用来做这个吗？

浏览 7提问于2009-12-18得票数 1

回答已采纳

1回答

Word2vec内存和时间消耗吗？

、、

我正在尝试用神经网络训练一个Word2Vec模型。我的问题如下：如果我错了，请纠正我: word2vec使用的输入文本与图像没有相同的数量级(就内存而言)？这是否意味着不需要使用GPU来训练word2vec模型，顺便说一句，64 to虚拟云机器就足以进行培训了吗？文字训练不能超过5-10Go吗？

浏览 0提问于2018-10-11得票数 0

1回答

Android PocketSphinx:从apk安装时没有编写语言模型文件

PocketSphinx工作得很好。还创建了一些专门的语音命令字典。当我安装PocketSphinx的时候，我会按照说明在我的设备上的/sdcard/android/ edu.cmu.pocketsphinx下创建数据和子文件夹。并提供了语言模型和dics。我正确地怀疑edu.cmu.pocketsphinx文件夹不是在我弟弟的手机上创建的。我把edu.cmu.Pocketsphinx-文件夹发送给他，让他手动安装，它可以正常工作。与构建路

浏览 2提问于2012-08-19得票数 2

1回答

斯芬克斯列senone.c错误和pocketsphinx_continuous bin_mdef.c错误

、

当我正在使用袖珍狮身人面像构建僧伽罗语音识别系统时，我遇到了两个主要错误:运行pocketsphinx_continuous sphinxtrain命令和命令，我的项目文件夹可以看到。运行狮身人面像运行命令后，我通过创建一个名为/usr/local/share/pocketsphinx/model/en-us/的文件夹si，将以下文件复制到pocketsphinx语言模型默认位置，mixture_weights

浏览 0提问于2015-07-28得票数 0

回答已采纳

1回答

删除稀有单词如何影响模型性能？

、、

假设您想要构建一个文本预测模型，并且您的数据集包含500万个words.The唯一单词(词汇量为59k)。但是，如果删除所有在整个数据集中出现少于4次的单词，唯一单词的数量将下降到20k。我想知道的是，删除这些罕见的词语是否会以任何方式影响我的模型性能？

浏览 5提问于2022-10-14得票数 -2

1回答

词汇表大小SpaCy模型'en_core_web_sm‘

、、、

我试着在SpaCy小模型中查看词汇表中的单词数量：谢谢!

浏览 6提问于2019-11-06得票数 2

回答已采纳

1回答

word2vec中的词汇表大小与矢量大小

、

我有6200个句子的数据(它们是表格"sign_or_symptoms Pathologic_function Pathologic_function“的三重奏)，但是这些句子中唯一的单词(词汇量)是181个，如何才能训练出这样低词汇量的句子的模型。是否有任何资源或研究适当的矢量大小取决于词汇量？

浏览 1提问于2018-11-20得票数 0

回答已采纳

1回答

Microsoft Speech SDK 11中的语法太多

、、、

我编写了一个简单的语音识别应用程序，可以将语法加载到引擎中。Additional information: Too many grammars have been loaded. Number of grammars cannot exceed 1024. Thread.CurrentThread.CurrentCulture = new CultureInfo("ru-RU"); Thread.CurrentThread.Cur

浏览 2提问于2014-12-29得票数 2

回答已采纳

1回答

Keras，如何用Softmax层的随机抽样来填充嵌入层

、

在我正在构建的模型中，我有以下层：我希望这个模型的下一层是一个嵌入层，它“代表”稠密层的选择。也就是说，我想知道怎么做吗？问候

浏览 0提问于2021-04-07得票数 0

1回答

如何从cmusphinx词典中删除单词？

、

如何删除西班牙语模型中未使用的单词？有可能吗？我只想修改这个模型的字典，删除未使用的单词。(我现在只想要50个字)。谢谢。

浏览 4提问于2016-11-12得票数 0

回答已采纳

1回答

如何实现"ok google“技术

、、、

我读过一些关于语音/语音识别的文章，我想知道它是如何工作的。例如，android上的"ok Google“和类似的案例？最后，如果你们知道一些libs (C/C++，如果可能的话)能够做到这一点，我会很高兴地实现一个“关键字观察器”。

浏览 4提问于2015-03-09得票数 1

回答已采纳

1回答

正确配置Pocketsphinx

、

我一直在运行Debian压缩的VM上安装Pocketsphinx0.7。这很好，我可以尝试识别来自files.Having的语音--我已经构建了一些python脚本，它们识别了我得到的一堆文件，然后估计了单词错误率。它们使用中描述的gstreamer。到目前为止，我使用的是原始的hmm，这是一本包含我测试数据中的单词的字典，也是我从我的教授那里得到的优化语言模型。这应该可以工作，因为它也在生产系统中运行。我现在的问题是，识别性能仍然很糟糕。另一件可能影响性能的事情是，pocketsphinx告诉我它没有权限访问hmm，尽管

浏览 1提问于2012-06-28得票数 5

回答已采纳

1回答