设置使用SpeechRecognitionEngine时的静默阈值

文章/答案/技术大牛

发布

1回答

、、

当在.NET框架的System.Speech.Recognition命名空间中使用SpeechRecognitionEngine类时，我认为是静默的输入(在来自SpeechRecognizedEventArgs.Result.Audio的音频中，峰值大约为-30 dbFS或更低)通常被识别为来自加载的语法的短语，置信度高(90%或更高)。是否可以设置幅度/音量阈值，低于该阈值</e

浏览 46提问于2019-04-24得票数 0

回答已采纳

1回答

语音识别程序为语法中不存在的口语单词随机显示预定义单词(在‘GramarBuilder()’中定义)。

、、

我是C#的新手，我不确定我是否在正确的论坛上写作。我正在建立一个简单的语音识别程序，该程序以语音命令为输入，执行语音到文本的翻译，然后搜索与该文本匹配的视频。我正在使用grammarBuider()并定义我自己的语法来进行更精确的语音识别。但问题是:当语法中不存在的任何单词被说出来时，程序就会随机启动在语法中定义的现有单词的显示/写入。所以, 我想要的是:如果我

浏览 0提问于2018-07-21得票数 3

1回答

Microsoft语音识别引擎在语法之间切换

、、、

所以我有这个语音识别代码，我一直在使用微软的语音识别引擎。不幸的是，它在理解声音方面并不是那么出色，所以我一直在考虑解决这个问题的方法。其中之一是在特定语法和通用词典语法之间进行切换。我似乎不知道如何在语法之间切换，尽管在无法识别给定语音的情况下。如果有人能帮我弄清楚如何构造它，那就是，每当我的commandList语法无法识别所拾取的语音时，就可以从我的commandList语法切换到DictationGrammar()。usin

浏览 7提问于2016-04-08得票数 3

3回答

使用sox剥离静默

我有大约20,000个.wav文件(所有语音线路)，我需要去掉开头和结尾的静默。我尝试过各种命令，但都不能让它正确地设置阈值。我在网上看到了很多关于这样做的评论，所以我一定是用错了这个命令。我也不知道如何让.X保持几秒钟的</e

浏览 0提问于2016-12-22得票数 8

4回答

如何维护打开的C#进程？

我写了这个：{ static public void Main(string[] args) SpeechRecognitionEngine_recognizer = new SpeechRecognitionEngine(); }} 我的申请立即启动和停止。为了使我的应用程序保持对_recognize

浏览 1提问于2015-07-03得票数 0

回答已采纳

1回答

取消同步语音识别

、、

使用MSDN的SAPI，如何取消同步语音识别操作，或者至少立即停止它？class MainClass { SpeechRecognitionEngine recognizer =new SpeechRecognitionEngine(); recognizer.L

浏览 4提问于2015-04-02得票数 3

回答已采纳

3回答

如何跟踪.wav文件中的无声区域？

、、、

如何跟踪wav文件中没有声音的部分？程序如何知道wav文件的音量很低？我将使用Java或MFC。

浏览 1提问于2009-11-27得票数 2

1回答

Pocketsphinx在单词检测时写入控制台，而不是等待静默

当前，下面的命令启动pocketsphinx并等待麦克风中的音量达到特定的阈值，开始录音，当音量降到阈值以下时，将开始处理录制的音频，如果检测到单词，则输出hello。pocketsphinx_continuous -inmic yes -keyphrase "hello" -kws_threshold 1e-30 由于环境可能有一点嘈杂，等待音量阈值下降可能需要比预期更长的时间有没有办法让Pocketsphinx在说话时<

浏览 5提问于2016-09-07得票数 0

3回答

Cortana API是否可用于桌面应用程序？

、、、

我想使用新的Cortana引擎在Windows10上开发一个Windows应用程序。不幸的是，据我所知，它似乎只在Windows phone8.1项目上可用(例如，我没有找到从不同类型的Visual Studio项目访问Windows.Media.SpeechRecognition名称空间的方法我也找不到好的API文档，只有一些非常简单的例子。基于Peter Torr的回答，我写了一些代码。我已经能够识别一些单词，但引擎似乎在尝试识别一些简单

浏览 2提问于2015-08-11得票数 14

回答已采纳

2回答

语音识别无法正常工作

、、

我正在开发一个使用语音识别的WPF应用程序。当说出语法单词时，事件不会触发。其次，我不确定发动机是否在不启动时启动。如何检查呢？以下是代码。MainWindow.xaml public partial class MainWindow : Window private SpeechRecognitionEnginerecEngine =

浏览 2提问于2014-06-19得票数 0

2回答

将System.Speech与Kinect结合使用

、、、、

我将在稍后的项目中使用手势识别，所以我认为使用Kinect作为麦克风源是一个好主意，而不是使用额外的麦克风。我的应用程序的想法是识别自发的语音，比如长而复杂的句子(我知道语音听写不会不完美)。当我使用Kinect作为直接麦克风音频源时，我已经设法让它工作了，但由于我正在加载Kinect以进行视频预览和手势识别，所以我无法作为直接麦克风访问它。这是直接访问麦克风的代码，不需要加载Ki

浏览 7提问于2011-12-04得票数 30

2回答

在Windows7上使用语音识别C# WPF应用程序的两个问题

、、、、

我制作了一个应用程序，它使用SpeechRecognizer类来设置简单的语法并识别简单的单词。当我在Win7上运行它时，我注意到两件事。2)当我在我的应用程序中第二次说出我正在识别的一个单词时，它不会触发事件-相反-它会选择我的应用程序上的文本，我在列表框中打印出识别单词的历史记录。注意:当我从主屏幕中删除历史列表框时，它可以正常工作。显然，Win7首先尝试在我的UI中查找单词

浏览 6提问于2011-03-14得票数 2

回答已采纳

1回答

Python中的实时离线语音识别

、、

我已经使用Python语音识别工作了大半个月，制作了一个类似JARVIS的助手。我已经通过Google Speech API和Pocketsphinx使用了语音识别模块，并且我直接使用了Pocketsphinx，而没有使用其他模块。虽然识别是准确的，但我很难处理这些软件包处理语音所需的大量时间。它们的工作方式似乎是从一个静默点记录到另一个静默点，然后将记录传递给STT引擎。当查看Google Assistant语音识

浏览 1提问于2018-07-26得票数 14

1回答

在使用snd_pcm_writei()播放音频时，如何正确处理ALSA编程中的xrun？

、

我尝试过多个示例程序，这些程序的代码似乎可以在播放时处理xrun：当使用snd_pcm_writei()时，当返回值为-EPIPE (它是xrun/underrun)时，它们会： if然而，如果我有其他的东西使用声卡，如Firefox，我会得到更多的xrun，有时只运行xrun。但是，即使我杀死了使用声卡的任何其他程序，我仍然会遇到一些初始的xrun和扬声器上的<

浏览 42提问于2019-12-18得票数 3

1回答

从mp3文件中提取和分析声音

我有一组mp3文件，其中一些具有延长的静默时间段或周期性静默间隔。如何以编程方式检测到此问题？我正在寻找C++中的库，或者最好是C#中的库，它将允许我检查这些文件的声音内容是否为静音。编辑:我应该详细说明我想要实现的目标。我正在使用VLC捕获流媒体体育评论，并将其保存到mp3。当游戏被延迟或取消时，流评论被一条重复的消息取代，说明评论不可用。通过查找这些周期性静默(或完全静默)，

浏览 0提问于2011-04-17得票数 3

回答已采纳

2回答

SpeechRecognitionEngine.InstalledRecognizers()在统一中返回null

、、、、

我试图使用.NET 3.0框架中的语音识别系统。因此，我已经将System.Speech.dll从.NET 3.0中导入到资产文件夹中，因为更高版本无法工作，以及它的依赖项。我知道我想做的事情可能行不通，因为团结使用的是.NET 2.0，但我仍然想尝试一下。[0]); 当我在团结之外运行同一行代码时，它工作得很好，只获取默认的和第一个识别器，但不知怎么的，它在联合内部不起作用。我尝试过在使用.NET 2.0而不是.N

浏览 1提问于2015-09-21得票数 2

回答已采纳

1回答

System.InvalidOperationException“语法语言与语音识别器的语言不匹配”

、、、

首先，我使用Windows 7家庭高级，我的操作系统是土耳其。其次，当我尝试进行语音识别时，我得到了以下例外：附加信息:语法语言与语音识别器

浏览 3提问于2014-08-23得票数 0

回答已采纳

1回答

如何在AVAudioRecorder中检测静默？

、、

我使用AVAudioRecorder进行语音记录。目前，我使用averagePowerForChannel和peakPowerForChannel来显示动态仪表。我如何检测静默(1秒内没有人说话)并停止录音？

浏览 0提问于2011-05-25得票数 2

回答已采纳

3回答

JDBC驱动程序如何实现setMaxRows方法？

、、、、

根据JDBC规范，方法应该：即使在选择数百万行时，setMaxRows的性能似乎也不会更差。这可能是因为数据库执行程序可能使用一个数据库游标，它只在需要时获取记录，所

浏览 12提问于2015-09-25得票数 3

回答已采纳

1回答

使用语音命令启用和禁用语音识别

、、、

我的问题有两部分。 case "Stop Listening": recEngine.RecognizeAsyncStop();Start Listening" recEngine.RecognizeAsyncStop "until&quo

浏览 2提问于2015-07-13得票数 3

点击加载更多