腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
设置
使用
SpeechRecognitionEngine
时
的
静默
阈值
、
、
当在.NET框架
的
System.Speech.Recognition命名空间中
使用
SpeechRecognitionEngine
类
时
,我认为是
静默
的
输入(在来自SpeechRecognizedEventArgs.Result.Audio
的
音频中,峰值大约为-30 dbFS或更低)通常被识别为来自加载
的
语法
的
短语,置信度高(90%或更高)。是否可以
设置
幅度/音量
阈值
,低于该
阈值</e
浏览 46
提问于2019-04-24
得票数 0
回答已采纳
1
回答
语音识别程序为语法中不存在
的
口语单词随机显示预定义单词(在‘GramarBuilder()’中定义)。
、
、
我是C#
的
新手,我不确定我是否在正确
的
论坛上写作。我正在建立一个简单
的
语音识别程序,该程序以语音命令为输入,执行语音到文本
的
翻译,然后搜索与该文本匹配
的
视频。我正在
使用
grammarBuider()并定义我自己
的
语法来进行更精确
的
语音识别。但问题是:当语法中不存在
的
任何单词被说出来时,程序就会随机启动在语法中定义
的
现有单词
的
显示/写入。所以, 我想要
的
是:如果我
浏览 0
提问于2018-07-21
得票数 3
1
回答
Microsoft语音识别引擎在语法之间切换
、
、
、
所以我有这个语音识别代码,我一直在
使用
微软
的
语音识别引擎。 不幸
的
是,它在理解声音方面并不是那么出色,所以我一直在考虑解决这个问题
的
方法。其中之一是在特定语法和通用词典语法之间进行切换。我似乎不知道如何在语法之间切换,尽管在无法识别给定语音
的
情况下。如果有人能帮我弄清楚如何构造它,那就是,每当我
的
commandList语法无法识别所拾取
的
语音
时
,就可以从我
的
commandList语法切换到DictationGrammar()。usin
浏览 7
提问于2016-04-08
得票数 3
3
回答
使用
sox剥离
静默
我有大约20,000个.wav文件(所有语音线路),我需要去掉开头和结尾
的
静默
。我尝试过各种命令,但都不能让它正确地
设置
阈值
。我在网上看到了很多关于这样做
的
评论,所以我一定是用错了这个命令。 我也不知道如何让.X保持几秒钟
的</e
浏览 0
提问于2016-12-22
得票数 8
4
回答
如何维护打开
的
C#进程?
我写了这个:{ static public void Main(string[] args)
SpeechRecognitionEngine
_recognizer = new
SpeechRecognitionEngine
(); }} 我
的
申请立即启动和停止。为了使我
的
应用程序保持对_recognize
浏览 1
提问于2015-07-03
得票数 0
回答已采纳
1
回答
取消同步语音识别
、
、
使用
MSDN
的
SAPI,如何取消同步语音识别操作,或者至少立即停止它?class MainClass {
SpeechRecognitionEngine
recognizer =new
SpeechRecognitionEngine
(); recognizer.L
浏览 4
提问于2015-04-02
得票数 3
回答已采纳
3
回答
如何跟踪.wav文件中
的
无声区域?
、
、
、
如何跟踪wav文件中没有声音
的
部分?程序如何知道wav文件
的
音量很低?我将
使用
Java或MFC。
浏览 1
提问于2009-11-27
得票数 2
1
回答
Pocketsphinx在单词检测时写入控制台,而不是等待
静默
当前,下面的命令启动pocketsphinx并等待麦克风中
的
音量达到特定
的
阈值
,开始录音,当音量降到
阈值
以下
时
,将开始处理录制
的
音频,如果检测到单词,则输出hello。pocketsphinx_continuous -inmic yes -keyphrase "hello" -kws_threshold 1e-30 由于环境可能有一点嘈杂,等待音量
阈值
下降可能需要比预期更长
的
时间有没有办法让Pocketsphinx在说话
时<
浏览 5
提问于2016-09-07
得票数 0
3
回答
Cortana API是否可用于桌面应用程序?
、
、
、
我想
使用
新
的
Cortana引擎在Windows10上开发一个Windows应用程序。不幸
的
是,据我所知,它似乎只在Windows phone8.1项目上可用(例如,我没有找到从不同类型
的
Visual Studio项目访问Windows.Media.SpeechRecognition名称空间
的
方法我也找不到好
的
API文档,只有一些非常简单
的
例子。基于Peter Torr
的
回答,我写了一些代码。我已经能够识别一些单词,但引擎似乎在尝试识别一些简单
浏览 2
提问于2015-08-11
得票数 14
回答已采纳
2
回答
语音识别无法正常工作
、
、
我正在开发一个
使用
语音识别的WPF应用程序。当说出语法单词
时
,事件不会触发。其次,我不确定发动机是否在不启动
时
启动。如何检查呢?以下是代码。MainWindow.xaml public partial class MainWindow : Window private
SpeechRecognitionEngine
recEngine =
浏览 2
提问于2014-06-19
得票数 0
2
回答
将System.Speech与Kinect结合
使用
、
、
、
、
我将在稍后
的
项目中
使用
手势识别,所以我认为
使用
Kinect作为麦克风源是一个好主意,而不是
使用
额外
的
麦克风。我
的
应用程序
的
想法是识别自发
的
语音,比如长而复杂
的
句子(我知道语音听写不会不完美)。当我
使用
Kinect作为直接麦克风音频源
时
,我已经设法让它工作了,但由于我正在加载Kinect以进行视频预览和手势识别,所以我无法作为直接麦克风访问它。这是直接访问麦克风
的
代码,不需要加载Ki
浏览 7
提问于2011-12-04
得票数 30
2
回答
在Windows7上
使用
语音识别C# WPF应用程序
的
两个问题
、
、
、
、
我制作了一个应用程序,它
使用
SpeechRecognizer类来
设置
简单
的
语法并识别简单
的
单词。 当我在Win7上运行它
时
,我注意到两件事。2)当我在我
的
应用程序中第二次说出我正在识别的一个单词
时
,它不会触发事件-相反-它会选择我
的
应用程序上
的
文本,我在列表框中打印出识别单词
的
历史记录。注意:当我从主屏幕中删除历史列表框
时
,它可以正常工作。显然,Win7首先尝试在我
的
UI中查找单词
浏览 6
提问于2011-03-14
得票数 2
回答已采纳
1
回答
Python中
的
实时离线语音识别
、
、
我已经
使用
Python语音识别工作了大半个月,制作了一个类似JARVIS
的
助手。我已经通过Google Speech API和Pocketsphinx
使用
了语音识别模块,并且我直接
使用
了Pocketsphinx,而没有
使用
其他模块。虽然识别是准确
的
,但我很难处理这些软件包处理语音所需
的
大量时间。它们
的
工作方式似乎是从一个
静默
点记录到另一个
静默
点,然后将记录传递给STT引擎。当查看Google Assistant语音识
浏览 1
提问于2018-07-26
得票数 14
1
回答
在
使用
snd_pcm_writei()播放音频
时
,如何正确处理ALSA编程中
的
xrun?
、
我尝试过多个示例程序,这些程序
的
代码似乎可以在播放
时
处理xrun: 当
使用
snd_pcm_writei()
时
,当返回值为-EPIPE (它是xrun/underrun)
时
,它们会: if然而,如果我有其他
的
东西
使用
声卡,如Firefox,我会得到更多
的
xrun,有时只运行xrun。但是,即使我杀死了
使用
声卡
的
任何其他程序,我仍然会遇到一些初始
的
xrun和扬声器上
的<
浏览 42
提问于2019-12-18
得票数 3
1
回答
从mp3文件中提取和分析声音
我有一组mp3文件,其中一些具有延长
的
静默
时间段或周期性
静默
间隔。如何以编程方式检测到此问题? 我正在寻找C++中
的
库,或者最好是C#中
的
库,它将允许我检查这些文件
的
声音内容是否为静音。编辑:我应该详细说明我想要实现
的
目标。我正在
使用
VLC捕获流媒体体育评论,并将其保存到mp3。当游戏被延迟或取消
时
,流评论被一条重复
的
消息取代,说明评论不可用。通过查找这些周期性
静默
(或完全
静默
),
浏览 0
提问于2011-04-17
得票数 3
回答已采纳
2
回答
SpeechRecognitionEngine
.InstalledRecognizers()在统一中返回null
、
、
、
、
我试图
使用
.NET 3.0框架中
的
语音识别系统。因此,我已经将System.Speech.dll从.NET 3.0中导入到资产文件夹中,因为更高版本无法工作,以及它
的
依赖项。我知道我想做
的
事情可能行不通,因为团结
使用
的
是.NET 2.0,但我仍然想尝试一下。[0]); 当我在团结之外运行同一行代码
时
,它工作得很好,只获取默认
的
和第一个识别器,但不知怎么
的
,它在联合内部不起作用。我尝试过在
使用
.NET 2.0而不是.N
浏览 1
提问于2015-09-21
得票数 2
回答已采纳
1
回答
System.InvalidOperationException“语法语言与语音识别器
的
语言不匹配”
、
、
、
首先,我
使用
Windows 7家庭高级,我
的
操作系统是土耳其。其次,当我尝试进行语音识别
时
,我得到了以下例外:附加信息:语法语言与语音识别器
浏览 3
提问于2014-08-23
得票数 0
回答已采纳
1
回答
如何在AVAudioRecorder中检测
静默
?
、
、
我
使用
AVAudioRecorder进行语音记录。目前,我
使用
averagePowerForChannel和peakPowerForChannel来显示动态仪表。我如何检测
静默
(1秒内没有人说话)并停止录音?
浏览 0
提问于2011-05-25
得票数 2
回答已采纳
3
回答
JDBC驱动程序如何实现setMaxRows方法?
、
、
、
、
根据JDBC规范,方法应该: 即使在选择数百万行时,setMaxRows
的
性能似乎也不会更差。这可能是因为数据库执行程序可能
使用
一个数据库游标,它只在需要
时
获取记录,所
浏览 12
提问于2015-09-25
得票数 3
回答已采纳
1
回答
使用
语音命令启用和禁用语音识别
、
、
、
我
的
问题有两部分。 case "Stop Listening": recEngine.RecognizeAsyncStop();Start Listening" recEngine.RecognizeAsyncStop "until&quo
浏览 2
提问于2015-07-13
得票数 3
点击加载更多
相关
资讯
对抗样本的反思:仅仅设置更小的扰动阈值ε,或许并不够
Python下opencv使用笔记(二)(图像的阈值处理
使用AI工具时必须注意的隐私设置
使用微信时这几项一定要设置好?
工作时使用CSS时可以免费使用的在线工具
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券