语音识别在颤动后语音输入部分的文本正在进行api调用

文章/答案/技术大牛

发布

1回答

android、ios、flutter、dart

稍后，当我收到文本时，它会将文本分成几部分发送。我使用的是speech_recognition插件，在这里我输入语音命令，文本被发送到一个创建的应用程序接口，但问题是它将文本分成几个部分发送到应用程序接口。示例:实际文本:现在是什么时间，但有时字符串会重复2次API调用，或者有时它一次只发送几个单词 _speechRecognition.setAvailabilityHan

浏览 5提问于2019-10-16得票数 2

回答已采纳

2回答

在Google应用程序上设置语音识别上下文？

speech-recognition、actions-on-google、google-speech-api

我有一个Google应用程序，它使用Google客户端Javascript库上的操作：语音识别效果非常好。但有时我会遇到一种认知环境，它有一些小麻烦。有没有办法告诉语音识别设施，以强调在每个用户交互的基础上特定短语的概率？例如，如果用户被要求指定一个日期，那么一年中的几个月的概率就会超过正常值吗？在一些语音识别引擎中，您可以提供词汇表(也称为语法等等)。到引擎上。有没有办法用谷歌应用程序的动作来做到这一点呢？我知道谷歌的<

浏览 2提问于2017-10-13得票数 2

3回答

如何设置语音识别服务器？

java、speech-recognition、speech、speech-to-text

如何在服务器端实现语音识别(请不要建议HTML5's x-webkit-speech，javascript等)？该程序将以一个音频文件作为输入，并以足够的准确性提供音频文件的文本转录。我尝试过实现，但是它的准确性太差了(它们可能也是我的配置中的一些问题，我还在努力学习它)。任何现有的开源服务器如果能够以最小的错误率识别英语句子，也将是有用的。

浏览 6提问于2012-01-18得票数 1

回答已采纳

1回答

如何在从其他活动返回到mainActivity的edittext中恢复之前输入的文本？

android、android-studio、android-edittext

我有一个包含两个活动的基本应用程序，如下图所示：The left screen is mainActivity, right screen is secondActivity 如果用户在第二个活动上按下我希望用户在第一个活动中输入的文本(通过语音输入或直接作为文本)再次显示在可编辑文本字段中。，它将在返回到它时恢复，但我不会在我的mainActivity中的任何地方调用mainActivity ()。执行此操作的最

浏览 24提问于2021-03-26得票数 1

1回答

SFSpeechURLRecognitionRequest只有在线程调用完成后才会输出语音识别结果

swift、macos、speech-recognition

虽然我让它以初步的形式工作，但我遇到了一个奇怪的问题。在我的测试应用程序中，它似乎只在主线程终止后才输出语音识别结果(包括部分和完整)。请注意，如果我在print之前添加一个sleep(5)，它将等待5秒，然后输出print，并且只有在主线程结束后才开始处理文本。我在GUI测试应用程序中看到过类似的行为，它只在启动请求的方法调用完成后才开始处理文本。我尝试反复检查返回的<

浏览 0提问于2021-01-02得票数 0

5回答

Google函数和AWS的超时问题

javascript、amazon-web-services、google-cloud-platform、aws-lambda、google-cloud-functions

我们正在使用NodeJS处理长的文字记录，使用Google语音到文本API。许多功能需要10分钟以上的时间来处理。处理/音频时间的通常比率约为50%。因此，一个20分钟的FLAC音频文件大约需要10分钟来处理(因此，Google功能失败，最大时间为540秒或9分钟)，而在AWS Lambda上超过29分钟的任何文件都会失败。在每个平台上，哪种服务可以在20/30分钟内处理音频文件，这也允许发送和调用应用程序

浏览 6提问于2019-08-27得票数 8

回答已采纳

3回答

是否可以使用javascript来检测用户机器上是否正在运行屏幕阅读器？

javascript、html、accessibility、screen-readers

我想要检测用户的机器上是否正在运行屏幕阅读器，以避免与html中的音频标签发生声音冲突。如果是，请详细说明如何做到这一点。

浏览 0提问于2011-10-10得票数 33

回答已采纳

4回答

用于脚本WAV或MP3输出的文本到语音(TTS)软件

audio、windows-7、text-to-speech

希望我能在这里得到更多的观众。我正在寻找一个低成本(或免费)的解决方案，如只有一个更好的引擎。也就是说，读入脚本并将字符分配给语音。我读过这篇文章的，但即使有了这些，我也必须连接wav文件。我正在考虑写我自己的，但我相信一定会有解决方案的。有什么建议吗？

浏览 2提问于2012-04-07得票数 8

回答已采纳

5回答

Android语音识别与录音同时进行

android、android-asynctask、speech-recognition

我的应用程序使用AsyncTask中的MediaRecorder类录制音频，还使用Google API将语音转换为文本-识别器意图-使用这个问题中的代码：我也尝试过在Thread中录制音频，但这是一个更糟糕的解决方案它会带来更多的问题。我的问题是我的应用程序在模拟器上工作正常。但由于缺乏语音识别服务，仿真器不支持语音识别。在我的设备上，当我开始录制音频和

浏览 0提问于2011-08-23得票数 24

1回答

Jenkins pipeline -在C#中获取管道状态

c#、jenkins

有没有办法在代码中知道我启动了哪个构建，并使用一些rest API获得该构建的状态？

浏览 0提问于2018-08-16得票数 1

2回答

语音到文字Java应用程序的实时字幕可能吗？

java、google-api、speech-recognition

这是将Google语音转换为文本API：活动标题保存在文本文件中，而新标题则继续在文本文件

浏览 11提问于2022-04-12得票数 -4

回答已采纳

4回答

需要有关Ozeki (IP语音) VoIP SDK的反馈

sdk、sip、voip

我在一家小公司工作，我的老板告诉我在市场上四处寻找一个语音/视频SDK。我找到了一个叫做Ozeki SDK的VoIP。根据他们网站上的描述，这看起来很有希望。如果有人已经使用过这个SDK，请与我分享一些想法，这样我就可以给我的老板一个更好的报告。

浏览 0提问于2012-06-11得票数 4

1回答

一种公开VSCode活动“当子句上下文”的方法

visual-studio-code、vscode-extensions

为了让您更好地理解我的用例，下面是正在开发VSCode扩展的项目的一些背景知识。我的扩展将方便编程和通过语音控制VSCode。有限的键盘组合和并非所有功能都可以通过快捷方式调用。“拆分成行”：r(键(“cs-p”)+文本(“拆

浏览 5提问于2017-04-12得票数 2

回答已采纳

7回答

Amazon Alexa:存储用户的话

amazon、alexa-skills-kit、alexa-skill

我是编写Alexa技能的新手，我想写一种技能来存储演讲者的话。{ "intent" : "SaveIntent"}SaveIntent save SaveIntent

浏览 1提问于2016-05-16得票数 22

1回答

语音识别自学习模型?

语音识别

浏览 204提问于2022-06-15

4回答

luis.ai与api.ai与wit.ai的比较？

artificial-intelligence、wit.ai、azure-language-understanding、dialogflow-es

有没有人知道三者之间的具体区别和功能，或者作为开发人员是否有更多的功能/更灵活的使用？

浏览 74提问于2016-05-14得票数 82

回答已采纳

1回答

输入方法中的光标移动与文本检索

android、ime

目前，我有一个可访问的触摸屏键盘，使用类似于IOS/VoiceOver的方法，因此项目的一部分是在IME框架中完成的，而且相当直接。目前，Android的可访问性API没有为导航文本字段提供可访问的反馈。目前，我有关于左右箭头的语音反馈，使用getCurrentInputConnection.getTextBeforeCursor(1，0)来表示左箭头，以及类似的右箭头调用。这将在处理移动

浏览 6提问于2011-01-05得票数 1

13回答

如何让Python说话

python、text-to-speech

我怎样才能让Python说出一些文本呢？有没有Python TTS库？就像节日的应用程序接口，eSpeak，...？

浏览 1提问于2009-10-23得票数 71

回答已采纳

3回答

带有epoll和线程的套接字服务器

c、multithreading、sockets、pthreads、epoll

我试图在C中为协作实时编辑器创建一个套接字服务器，但我不知道它的最佳服务器架构是什么。首先，我试图为套接字服务器使用select，但在那之后，我读到了有关epoll的内容，现在我认为epoll是最好的选择，因为客户端将发送每封信，用户将在textarea上写信给服务器，因此服务器将拥有要处理的数据分配我的计划是第二个线程将有从客户端读取和发送数据的任务。我的问题是，对于线程使用epo

浏览 6提问于2011-11-28得票数 7

回答已采纳

1回答

在Google助手应用程序中读取用户联系人

dialogflow-es、actions-on-google、google-contacts-api、google-assistant-sdk

我正在尝试为我的消息应用程序添加谷歌助理会话功能。我已经实现了1和2的对话，但我无法实现3和4。我没有找到任何博客/源代码，它显示了如何选择联系人。这有可能吗？

浏览 1提问于2020-04-28得票数 0

回答已采纳

点击加载更多