视频语音识别报价_语音识别报价_实时语音识别报价 - 腾讯云开发者社区

、、

我想使用谷歌语音服务不是麦克风，而是视频文件。例如，一个视频文件正在我的计算机上播放，谷歌语音识别程序正在识别视频的音频流。Youtube的自动字幕功能。我怎样才能使用G.S.R？

浏览 5提问于2017-08-03得票数 4

回答已采纳

1回答

来自系统音频的C#语音识别(扬声器声音)

、

我见过来自输入设备的语音识别(显然)，也见过来自文件的语音识别()。然而，我想知道是否有可能在系统音频上实时运行语音识别。系统音频是指从扬声器中发出的声音。对于那些听力有障碍的人来说，这将是一个很好的工具，因为他们正在观看YouTube视频，C#应用程序可以转录正在说的话。我该怎么做呢？

浏览 2提问于2011-12-08得票数 0

回答已采纳

1回答

YouTube歌曲歌词识别

、、、、

许多YouTube视频都有歌词的自动字幕。我们相信他们正在使用谷歌语音识别API。然而，当我们使用谷歌语音识别API (或任何语音识别API)，我们没有得到准确的歌词。有时候，我们只能从这首歌中得到一行。为什么会这样？有没有人建议从一首歌中获得实时歌词？或者是用来训练音频的API/库？谢谢你的帮助!

浏览 10提问于2021-08-11得票数 0

回答已采纳

2回答

我正在做一个项目，在其他与视频相关的任务中，最终应该能够提取视频的音频，并对其应用某种语音识别，并获得视频上所说内容的转录文本。理想情况下，它应该输出某种字幕格式，以便文本链接到视频上的某个点。我在考虑使用Microsoft Speech API (又名SAPI)。但据我所知，它使用起来相当困难。我为语音识别找到的极少数示例(大多数是用于文本到语音的转换，这可能更容易)表现不是很好(他们不能识别任何东西)。例如这个：一些例子使用了一些叫做语法文件的东西来定义识别器正在等待的单词，但是由于我没有对Windows语音识别进行过彻底的训练，所以我认为这可能是在混淆结果。所以我的问题是。对于这样

浏览 0提问于2011-08-28得票数 1

1回答

语音识别与MediaRecorder - Android

、、、

我正在制作一个应用程序，在其中我正在录制视频，同时想要实现语音到文本识别功能，没有语音对话，谁能告诉我如何继续。

浏览 9提问于2017-08-28得票数 1

1回答

Web语音API -不要忽视周围的噪音/音乐

、、、

因此，尽管这仍然有点令我震惊，谷歌默认的语音识别完全和完全忽略了音乐/环境噪音。问题是，对于我的用例，我希望它真的尝试转录音乐！我正在使用Chrome 72中的Web语音API和他们的演示程序。甚至当我把扬声器放在麦克风旁边的时候，我也不能把它从音乐中提取出来。我也不能让它从网上获取任何Youtube视频或视频。它也没有捡到我亚历克莎说的任何东西。我有一个Android，所以我假设他们在商业广告中做一些类似亚马逊的事情，播放一种无法听到的声音，用来抵消录音？有什么办法让这个失效吗？如果我直接从我的Mac或PC上播放音乐，它也不起作用。然而，如果我用视频聊天

浏览 2提问于2019-02-11得票数 0

回答已采纳

1回答

当通过USB连接HDMI时，Android devie将接管。

、、

我有一个简单的语音识别应用程序，很好地使用车载麦克风，但一旦我附加了HDMI电缆(通过HDMI捕获卡- USB-C) - android设备麦克风被接管。我怎样才能防止这种情况发生？为了使我的应用程序工作，我必须连接HDMI &仍然保持语音识别部分运行。这两件事隔离工作，我可以接收HDMI输入和录制视频饲料，我可以使用语音识别-但当这两者合并-我失去麦克风。

浏览 3提问于2022-04-25得票数 1

1回答

如何在视频文件上使用语音识别？

、、

如何编写语音识别引擎(使用Microsoft speech SDK)来“听”视频文件并将检测结果保存到文件中？

浏览 2提问于2009-11-09得票数 3

回答已采纳

1回答

Nativescript音频和视频通道

、、、

我刚接触nativescript，我想知道是否有任何插件可以像我们在浏览器上使用navigator.getmedia那样流式传输音频和视频数据。我正在尝试使用tensorflow实现语音安全(而不是识别)和面部识别

浏览 45提问于2019-03-11得票数 0

1回答

如何使用来翻译实时流？

、、、

这是Google语音API文档：我试了两个星期这个API，但仍然不能解决我的主要目的(翻译现场流媒体)。我正在使用PHP。(允许其他语言建议，我会自己找到的) 我在两周内能做的是：同步语音识别(<=1min) 异步语音识别(>1 1min和<=80min)。备注：我可以修改这个以接受3小时的视频。麦克风的实时语音识别：更新：在音频持续时间小于6秒的情况下执行流API。我不能做的是：如何翻译现场直播。例:无线流媒体(允许延迟) 视频/音频播放时如何翻译。(允许延迟) 更新：我

浏览 2提问于2017-05-25得票数 12

回答已采纳

1回答

谷歌云功能-视频智能

、、、

我知道如何通过Google触发用于对象跟踪/对象检测的视频智能请求，如下所示： video_client = videointelligence.VideoIntelligenceServiceClient() features = [videointelligence.enums.Feature.OBJECT_TRACKING] operation = video_client.annotate_video(gs_video_path, features=features) 如何触发品牌检测、场景检测、OCR、语音识别和名人识别的相同功能？

浏览 3提问于2021-01-22得票数 0

回答已采纳

1回答

防止.NET语音识别听/识别计算机说话人

、、

我知道这是一个很长的机会，非常困难，甚至不可能做到。但我还是要问这个问题。是否有任何方法可以防止.NET的SpeechRecognitionEngine (SAPI)听到或识别来自计算机扬声器的音频，而无需使用外部麦克风。一个例子就是播放一段YouTube视频或歌曲，而不是听那个视频或歌曲的音频形式，或者至少不把它识别为语音。谢谢

浏览 2提问于2015-02-19得票数 0

回答已采纳

1回答

如何使用AngularJS语音命令更改在$scope中声明的$scope变量？

、、、

我有一个简单的语音识别应用程序，启动和暂停基于语音命令的视频。我的问题是，当我给出$scope命令时，我在中声明的变量不会改变。其意图是当我使用“暂停”语音命令暂停视频时，文本区域中的数字将发生变化。 var myApp = angular.module('myApp', ['vjs.video']); myApp.controller("myCtrl", function MyCtrl($scope) { $scope.playtime = 0; $scope.$on('vjsVideoReady', funct

浏览 3提问于2017-09-03得票数 1

回答已采纳

1回答

使用摄像机拍摄时的语音识别

、、、、

我正在开发一个android应用程序，需要同时拍摄和使用语音识别。问题是，摄像机使用麦克风，因此语音识别api不会访问麦克风。我的解决方案是关闭摄像头中的音频，只录制视频。这个解决方案的问题是，当使用RecognitionListener时，您无法访问音频文件。然后我尝试在startActivityForResult中使用RecognizerIntent。这个解决方案的问题是，活动将打开一个“弹出窗口”，摄像机停止工作。有谁知道如何解决这个问题。

浏览 2提问于2015-07-03得票数 0

1回答

同步视频中的字幕

、、

我有一个文本文件，所有的话都在视频中说在正确的顺序，但没有时间参考。有没有办法使用这个文本文件在视频中放置字幕？我能想到的一种方法是使用语音识别，但大多数算法都不太准确，无法完成这项任务。

浏览 3提问于2016-01-20得票数 2

4回答

Kinect for Windows手势识别

、、、

我一直在研究的发行说明和特性，因为我想在我的项目中也加入手势识别。在上面的页面中，第一行提到“Kinect for Windows SDK使开发人员能够创建支持手势和语音识别的应用程序”。SDK提供语音识别API，可以轻松使用。但是，我不认为SDK中有任何手势识别API可用。Skeleton Tracking的API很容易使用，但随后必须对它们进行定制，以获得手势识别。我看过Windows Media Center的视频，这些视频可以通过手势等控制，也可以通过其他应用程序控制。我想知道是否所有这些应用程序都是定制的，并且必须编写自己的手势识别代码。目前，在我的项目中，我使用的是Codep

浏览 1提问于2012-03-20得票数 8

回答已采纳

1回答

缩放转录功能支持哪些语言？

、

流行的视频会议工具缩放支持通过网络客户端记录会议和自动记录会议。我在Zoom网站上找不到支持语言的任何信息。缩放语音识别与除英语以外的其他语言一起工作吗？

浏览 0提问于2021-04-21得票数 0

1回答

有什么工具可以生成带有候选场景更改的空白SRT文件？

、、、

我想在不存在SRT文件的视频文件中添加字幕。是否有任何工具可以自动扫描视频的音频，并创建一个只包含时间戳的空白SRT文件？我尝试了VisualSubSync，但是内置的扫描场景更改工具显然只适用于现有的SRT文件。基本上，我正在寻找一个开源离线等价的 (没有语音识别功能)。

浏览 4提问于2017-11-04得票数 0

1回答

语音识别程序为语法中不存在的口语单词随机显示预定义单词(在‘GramarBuilder()’中定义)。

、、

我是C#的新手，我不确定我是否在正确的论坛上写作。我正在建立一个简单的语音识别程序，该程序以语音命令为输入，执行语音到文本的翻译，然后搜索与该文本匹配的视频。我正在使用grammarBuider()并定义我自己的语法来进行更精确的语音识别。但问题是:当语法中不存在的任何单词被说出来时，程序就会随机启动在语法中定义的现有单词的显示/写入。所以, 我想要的是:如果我的语法Grammarbuilder中不存在任何单词，程序就不应该在屏幕上从语法中编写任何或任意的单词。相反，它应该向用户显示一条信息，即“程序的语法中不存在您说过的话，或者没有找到与您的语音搜索匹配的视频”。有人能

浏览 0提问于2018-07-21得票数 3

1回答

YouTube语音识别-音频包含一个特殊的词？

、、、

我正在考虑一种机制，来找出youtube视频中是否有一个特殊的词，例如“你好世界”。我不知道怎么做，但我的方法是：通过youtube-dl从youtube视频中提取音频 pocketsphinx_continuous语音识别与txt文件保存但这很不可靠。pocketsphinx_continuous不太好用。有人能提出一个很好的解决办法吗？谢谢你的帮助！

浏览 3提问于2014-04-29得票数 0

1回答

使用Youtube作为语音识别数据集

、

DNNs是一种巨大的数据需求算法，尤其是双向LSTM算法.对于语音识别模型，对于特定的语言/口音，缺少语音语料库。然而，YouTube也是一个巨大的库。我需要使用一些脚本/软件，它可以自动下载YouTube视频(可能只有音频)和相关的字幕，然后将其分割成20秒的片段，这样就可以用作训练语音语料库。有没有任何方式可以下载来自Youtube的字幕？给出一个音频和脚本，我如何将一个音频分割成20秒的片段，并在文字记录中做同样的剪辑？

浏览 0提问于2018-12-21得票数 0

1回答

为语音识别创建上下文无关文法

、、

我们想要创建一个语法文件。除了(hello|goodmorning)(jack|jill)之外，有没有其他方法可以先指定第一个单词的可能集合，然后指定第二个单词的集合？我们使用它来识别视频中的语音，以生成字幕。

浏览 2提问于2012-03-16得票数 0

1回答

Pydub安装问题- ModuleNotFoundError:没有名为“pydub”的模块

、、

我需要一个自动语音转录工具，我的视频编辑项目。我正在使用python语音识别库。为了将大音频文件拆分为小部分，我安装了pydub，并在脚本中添加了它的功能。虽然我检查并解决了ffmpeg的env路径问题，但仍然给出了以下错误： Traceback (most recent call last): File "..\VideoEditing\speech_transcript.py", line 4, in <module> from pydub import AudioSegment ModuleNotFoundError: No module name

浏览 20提问于2022-03-03得票数 0

2回答

用于登录web应用程序的语音识别

、、

我正在创建一个web应用程序，用户应该通过语音识别作为密码注册该应用程序。应识别语音以进行授权。有没有办法通过Java语言实现语音识别？ PS:如果用户提供语音，那么语音应该能够识别已经存储的语音，并能够登录应用程序。

浏览 2提问于2014-12-26得票数 2

3回答

如何识别用户什么时候开始和停止在android上说话？(Android系统中的语音识别)

、、、

我做了大量的研发工作，花费了大量的资源来解决我的问题，但是我没有得到任何正确的解决方案。我已经开发了一个应用程序，现在我想添加语音功能到它。所需的功能如下 1)当用户开始讲话时，它应该记录音频/视频和 2)当用户停止讲话时，应播放录制的音频/视频。 Note：这里的视频是指用户在这段时间内在应用程序中执行的任何操作。例如，点击按钮或某种动画，等等。我不想使用谷歌的语音识别器，因为它需要互联网，但我的应用程序运行offline.Also，我了解了。但根据我的要求，这是没有帮助的。编辑:-，我想补充的是，我已经使用“开始和停止”按钮实现了这个功能，但是我不想使用这些按钮。如果有人有任何想

浏览 8提问于2012-03-20得票数 4

1回答

在flash项目中集成.jar

、、、、

我必须将.jar文件集成到flash项目中。这个项目是这样的：将有一个用于Web浏览器的flash视频播放器，带有播放、暂停和停止命令。我必须使用语音命令来触发玩家的动作。我有一个可以进行语音识别的.jar，所以我想把这个文件集成到我的Flash Player中。这个是可能的吗？附言:你可能想知道为什么我不使用其他工具，但这是一个大学的项目与给定的材料，所以我真的需要使用Flash +这个给定的.jar。

浏览 1提问于2010-10-28得票数 1

回答已采纳

3回答

我如何在Ubuntu上使用Android使用的语音识别？

、

如果我正在开发一个使用TTS和语音识别的Android应用程序，那么在Ubuntu上哪个库用于相同的语音识别和语音呢？我假设是从文本到语音，但我不确定哪个语音识别库和字典/学习/校准系统用于语音识别。我想在Ubuntu桌面上提供这个应用程序。以及在仿真器外测试它。

浏览 0提问于2012-09-19得票数 16

回答已采纳

2回答

如何在tts说话时停止语音识别？

、、、

我正在制作一个同时使用语音识别和tts的应用程序。在我的应用程序中，我继续进行语音识别，问题是当我使用tts时，语音识别将监听应用程序的内容。如何在tts发言期间停止语音识别，然后在tts结束后启动语音识别？我能用另一种方式解决这个问题吗？

浏览 3提问于2014-03-09得票数 0

回答已采纳

1回答

SpeechRecogniton模块在python中太慢了

、

我试图使用语音识别为我的深度学习聊天机器人，以获得输入的用户。实际上，我的语音识别功能代码是： def get_audio(): r = sr.Recognizer() with sr.Microphone() as source: r.pause_threshold = 1 r.adjust_for_ambient_noise(source, duration=1) audio = r.listen(source) said = "" try: prin

浏览 1提问于2020-09-03得票数 2

回答已采纳

1回答

Android语音识别与文本到语音的冲突

、、

我已经基于这里给出的方法在我的应用程序中实现了连续语音识别：。它本身运行得相当好。但是，我想实现一个功能，即应用程序正在使用文本到语音的方式阅读网页，并且在阅读过程中，我希望打开语音识别，以便我可以要求它停止使用语音。然而，我看到语音识别也开始识别文本到语音的输出。有没有办法让它忽略从电话里传出的声音，只识别我在麦克风里说的话。

浏览 20提问于2016-09-22得票数 0

回答已采纳

1回答

使用System.Speech.Recognition打开Windows语音识别

、、

我试着用C#实现了一些简单的语音识别WinForms程序，就像Michael Levy回答中描述的那样：我的问题是，每当我运行Windows语音识别程序时，它都会打开，并且还会根据我所说的做一些事情。此外，当程序启动时，我必须说“开始听”，语音识别才能工作。我的问题是:如果不让Windows语音识别也按照我说的做，我如何使用语音识别？我根本不需要Windows语音识别UI打开，我需要能够使用识别，而不必说“开始听”之前。感谢您的回答

浏览 7提问于2011-07-09得票数 2

回答已采纳

2回答

基于语音(噪声)强度级别的语音识别？

、

我想建立一个android应用程序，它将识别我的声音，将其转换为文本，并将显示我刚才说的吐司。我能够做到这一点，使用按钮，将启动语音识别器为我。但现在我只想让它基于我的声音工作。应用程序应该触发语音识别器，只有当我开始说话时才开始收听，当它检测到静默时应该停止收听。就像会说话的应用程序的功能一样。在那里它记录了语音，但我想使用语音识别器来识别它。像这样的东西： if(no silense) Launch Recognizer else if(silence) Stop Recognizer Show toast 主要的问题是，在启动语音识别器之前，我如何感知用户是否在说话。有没有

浏览 6提问于2012-06-13得票数 1

回答已采纳

1回答

语音识别支持哪些语言？

、

语音识别支持哪些语言呢？文档没有写，只提到“实时流式语音识别适用于对识别时效要求严格的场景。目前支持的语言包括中文和英文。”但不确定离线或者在线的语音识别支持哪些语种。请在语音识别的《产品简介》中注明，谢谢！ [附加信息]

浏览 366提问于2018-04-02

4回答

语音识别引擎未触发Windows服务中的事件

、、

因此，我有一个使用system.speech识别引擎实现的带有语音识别的windows服务。当我启动服务时，我的语音识别代码运行得很好，但是没有任何语音识别事件触发。奇怪的是，如果我运行完全相同的代码，但在控制台或WPF应用程序中，触发语音识别的事件工作得很好。我已经将一个调试器附加到我的服务进程中，以检查幕后发生了什么。似乎语音识别引擎正确地加载语法，将其模式设置为连续收听，并正确地设置语音识别事件。没有抛出异常，所以我不太确定这里出了什么问题。有什么想法吗？

浏览 0提问于2012-04-30得票数 8

回答已采纳

1回答

Android:语音识别

、

可能是重复的，但我没有找到以下问题的答案。在过去的两天里，我一直在做一些关于语音识别的研究，但是我的问题没有得到答案：作为一项服务，可以运行语音识别吗？我想实现这样的东西:我需要打一个号码，虽然我的电话通过语音识别是在睡眠模式。当我在火车、公共汽车等的时候，语音识别能正确地检测出单词吗？除了语音识别之外，是否有任何传感器来检测声音？要使语音识别正常工作，用户是否需要靠近电话说话？

浏览 4提问于2012-12-24得票数 6

回答已采纳

3回答

html5视频的timeupdate事件多久触发一次

、、

学习html5的东西。这真是太棒了！想知道timeupdate事件触发的频率。附注: js video api有很多有趣的可能性。例如，可以使用ctrl +F来搜索视频。运行语音识别作为视频处理的一部分，然后创建一个长键值存储，将时间戳作为键，将单词作为值，并编写一个函数来搜索这些单词的实例，但返回时间戳并查找视频。无论如何，这只是youtube应该采纳的一个疯狂的想法。任何关于时间更新的帮助都将是很棒的！

浏览 14提问于2012-03-13得票数 16

回答已采纳

1回答

Python中的音频处理

、、、

我正在尝试分析电影内容，并想对电影的视频文件运行语音识别程序。首先，我需要从电影中提取音频，但我似乎找不到最好的方法来做到这一点。有许多库可以帮助分析.wav和.mp3文件，但是有没有一个库可以从视频中提取音频，而不是将其保存到中间音频文件中(可能直接将其作为振幅数组读取以进行分析)？我使用的是Python，但是里面的任何包都会很有帮助。

浏览 3提问于2016-02-02得票数 0

2回答

Google语音API与Web语音API的区别

、

我正在研究网络语音识别。我发现Google为开发者提供了一个名为“V2”的API。但是我注意到每天使用它是有限度的。之后，我发现有一个本地的WEB语音API也可以实现语音识别。它只是在google chrome和opera上工作：那么，Google语音API和Web语音API有什么不同呢？他们有关系吗？语音识别结果json是从谷歌回来的。谷歌语音api会比网络语音api更精确吗？谢谢。

浏览 2提问于2015-09-11得票数 17

回答已采纳

1回答

android中的语音识别是如何工作的？

、

我想知道android中的语音识别是如何工作的？它使用哪个库进行语音识别？它是自己在设备/移动设备上执行语音识别过程，还是将所有语音发送到google服务器并接收文本作为响应？谢谢，桑尼。

浏览 2提问于2009-09-04得票数 10

回答已采纳

1回答

将语音设置为密码的Windows工具

、、、、

我正在寻找一个程序来验证我的Windows操作系统基于我的声音和我说的话。需求：文本密码应改为语音密码。识别语音调制和验证用户应进行密码的离线验证。操作系统: Windows平台。共享软件将被接受，但免费软件更好。附加信息：下面的软件供应商已经试过了，但遗憾的是，它们不适合离线使用，而且都是基于企业解决方案的，除此之外，它是语音识别而不是语音识别： (对于那些对语音和语音识别之间的区别感到困惑的人，你可以使用在这里读到它。) 烈火阿莫沃克斯生物验证 Csid KYC安全 Lexis Nexis风险米斯特拉尔(开放源码) 细微差别安全复位 (使用Voxeo) 感官说话 S

浏览 0提问于2014-07-25得票数 11

1回答

西班牙语的语音(语音)识别

、

我在android的语音识别API上工作。我是语音识别Api的新手，我的要求是作为西班牙语的语音，并从Android的语音识别API在西班牙语中获得最佳匹配文本。所以，求求你！如果你对此有任何解决方案，请让我知道。提前谢谢。

浏览 7提问于2014-03-03得票数 2

1回答

使用google语音识别时忽略背景音乐

、

我正试着制作一个闹钟Android应用程序，可以用语音识别来阻止它。为此，我使用谷歌语音识别API (+ 不断进行语音识别)。它很好，直到我同时演奏音乐。在这种情况下，语音识别的效率要低得多。这个问题是合乎逻辑的，因为音乐增加了一些噪音，使识别更加困难。但由于播放的音乐是已知的，我想知道是否可以告诉谷歌试图忽略这些额外的噪音。我知道在信号处理中存在一些滤波器来实现这一点(比如或)。因此，我的问题是：是否有可能应用带有谷歌语音识别的过滤器来忽略已知的噪声？，还是有其他语音识别库允许这样做？编辑:这不是重复，因为问题是不一样的。但是很有趣的建议。

浏览 0提问于2018-01-27得票数 4

1回答

SpeechRecognition接口:如何获取语音特征(MEL系数)

、、、

我打算为Android实现一个说话人验证应用程序，我想知道是否有办法从Android的语音识别模块中获取语音特征(MEL系数)？请注意，说话人验证与语音识别略有不同，这就是我不直接使用语音识别的原因。

浏览 0提问于2014-04-10得票数 0

1回答

使用语音/语音识别在我的应用程序中执行指令

、、、、

你好，我想要一些知识，使用语音/语音识别，以执行指示在我的游戏。我对游戏开发相当陌生，我正在使用libgdx来构建我的游戏。我知道语音识别api的存在。我想知道它们是如何工作的，就像我如何将它们集成到我的游戏中一样。我希望用户能够说跳转和(玩家)跳，我想使用的语音命令是非常基本的，例如射击和球员应该发射子弹。如果有人似乎对语音/语音识别api有一些了解，我想知道是否有一种简单的方法，我可以设置语音识别api，在听到诸如“跳转”这样的特定关键字时，我将使用该api执行特定的操作。任何答案都会有帮助，因为我的知识非常有限，使用api和语音识别。

浏览 7提问于2014-06-19得票数 0

回答已采纳

1回答

通过语音识别从预先存在的脚本中生成字幕

、、、

假设我有音频和该音频的明文文本，我如何使用语音识别以编程方式从这两个字幕生成字幕？这与YouTube在编辑视频时在其字幕/字幕页面上提供的功能非常相似。有什么API可以做到这一点？它的一些挑战是什么？我精通Java/C#，但这是语言不可知的。

浏览 1提问于2012-07-01得票数 1

2回答

使用CNTK创建c#应用程序

、、、

我刚接触认知工具包，还在探索如何使用它。但我几乎找不到任何关于如何使用认知工具包创建应用程序的资源或视频。我希望建立类似于Cortana或siri的语音识别和导航应用程序。任何关于如何在visual studio应用程序中使用认知工具包的建议都将不胜感激。

浏览 6提问于2017-05-22得票数 1

1回答

Google语音识别在电影上的应用

、

我用自然对话的获得了很好的效果，但是对于Youtube视频或电影的声音识别很差或者根本不存在。在我的iPhone 4上录制西班牙语和英语的声音都可以识别，但在看电影时用同一部手机几乎是不可能的，即使是一个人物说话的场景，背景噪音也很小。只有一次成功。我试着用清理声音，使用noisered和compand efects，但没有成功。有什么想法吗？或者仅仅是Google API不能识别的声音，因为你改变了更多？它会在其他语音识别软件上取得更好的成功吗？

浏览 0提问于2013-06-03得票数 3

1回答

保持webrtc流/网页之间的连接

、、、

在使用WebRTC (语音和视频)时，我有一个特定的问题。我想保持一个连接/声音/视频流之间的网页之间的网站活着。我想我可以使用共享的网络工作人员在后台运行？任何指导都是很好的。我看过其他帖子，但它们都很老了，我想知道是否有更多的，最新的信息，或者我可以解决这个问题的方法？更新：共享Workers是解决此问题的不正确方法。服务工作者是网页终止后维护的前进方向。

浏览 2提问于2016-02-20得票数 2

回答已采纳

1回答

什么时候限制iOS中的语音识别，即requestAuthorization返回requestAuthorization

、、

我正在制作一个应用程序，它将使用语音识别，并想知道我的应用程序多久会遇到这种情况我知道这与限制语音识别的设备有关，而不是用户，但具体是什么时候?？是由于某些特定的模型不支持语音识别，还是iOS版本特定，还是有一些设置可以限制应用程序使用语音识别？

浏览 0提问于2019-08-23得票数 1

回答已采纳

1回答

同时实现语音识别和信号可视化

、、、

我正在使用Kinect + Microsoft.Speech进行语音识别。要获得输入音频流，必须执行以下操作 Stream kinectAudioStream = myKinect.AudioSource.Start(); 并开始语音识别 speechRecognitionEngine.SetInputToAudioStream(kinectAudioStream, new SpeechAudioFormatInfo(...)); speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple); 我的目标是实时可视化输入信号(

浏览 0提问于2013-07-17得票数 1