使用音频文件测试Google Speech API

文章/答案/技术大牛

发布

1回答

语音识别sppech到文本在python中不起作用

、、

import speech_recognition as srimport os audio = r.listen(source) text = (r.recognize_google

浏览 26提问于2019-12-06得票数 0

回答已采纳

2回答

我可以在ANDROID中将mp3文件转换为文本吗？

、、

我不是在说使用语音识别器！！我的意思是mp3中的文件必须是从sd中挑选出来的，而不是实时记录和分析的？谢谢！！

浏览 3提问于2016-01-22得票数 3

0回答

、、、

我想看看Google Speech API是否对我的目的足够准确。我有一个音频文件，我想测试它，但在主页上的演示只允许您从麦克风录制。有没有一种方法可以在不学习API的情况下用音频文件测试Google的语音处理？

浏览 1提问于2017-06-13得票数 2

1回答

如何从google语音到文本api获取音频文件？

、、、

我正在使用google speech api从speech获取文本。我也想得到音频文件，我的发言或浏览器记录。我能拿到这个音频文件吗。谢谢。

浏览 2提问于2020-05-06得票数 0

1回答

Google Speech to Text不能处理大文件

、、

我正在尝试使用Google speech api将音频文件转换为文本。如果音频是30秒或更短，它的工作正常，但当音频文件长于30秒，那么它不会将音频文件转换为文本。请帮帮我，我该怎么办？

浏览 17提问于2017-12-27得票数 1

1回答

当得知Google终于发布了面向开发人员的官方speech API时，我超级兴奋。我一直对谷歌的语音识别在Android、Chrome和其他产品上的出色表现感到惊讶。我创建了一个Google Cloud帐户，启用了speech API，并按照创建了一些测试脚本。精确度非常高，但速度却慢得离谱。一个18秒的音频文件将花费他们的引擎大约16秒来转录！Microsoft Bing Speech API只需3-4秒即可完成！

浏览 2提问于2016-08-19得票数 3

2回答

使用Google Api: PC版语音转文本

、

Google Chrome提供了语音转文本( speech to text，STT )，因此许多智能手机应用程序都提供了STT。它有很好的认知度。如果我使用Google Speech来给Api发短信，这个问题就很容易解决了。如果没有关于STT的公共google api，请告诉我除了使用start之外的其他方法。

浏览 6提问于2012-09-19得票数 2

回答已采纳

1回答

如何在nodejs上连接/连接音频缓冲区数组(文本到语音结果)？

、

我想将多个文本转换成一个音频，但我很困惑如何将多个音频连接到单个音频文件中(由于5k字符/请求限制，无法将长文本转换为音频)。我现在的代码在下面。是否建议在TTS领域使用LINEAR16？我很高兴听到任何建议。谢谢。

浏览 0提问于2021-11-03得票数 0

回答已采纳

1回答

将音频文件拆分为多个部分，但我需要在语音识别中使用这些文件

、、、

我在谷歌语音识别中遇到了关于长音频文件的问题。所以我决定在15秒内拆分我的音频文件。每次我发送第一个15秒到语音识别，然后第二个15秒，以此类推… 但是现在当我使用pydub lib时，它分割音频文件，分割后的返回值不是文件扩展名，因为API需要一个文件扩展名作为参数(我标记了错误)，key # to use another API key, use `r.recognize_google(audio, key="GOOGLE_<

浏览 20提问于2021-03-18得票数 0

回答已采纳

1回答

如何使用google convert将语音转换为基于印度口音的文本

、、、、

我正在尝试使用google could APIs转换语音到文本，像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US：这里我上传(.wav)音频文件，并转换为文本。有人能帮上忙吗？桑迪普。

浏览 11提问于2021-07-09得票数 0

2回答

Google speech to text api / Google cloud speech解决方案中的用户数据隐私

、

当我使用Google speech to text api或google cloud speech solution时，数据隐私保持在什么级别。我想知道这一点，因为我正在开发一个将音频文件转换为文本的应用程序，这些文件可能包含用户敏感数据。

浏览 1提问于2017-06-16得票数 13

1回答

如何修复“丢失的google-api-python-client”？使用Python、Jupyter Notebook和SpeechRecognition

、、、

我试图使用Python3.x，jupyter notebook和SpeechRecognition库对一些音频文件执行语音识别，但我得到了： 'RequestError: missing google-api-python-clientmodule: ensure that google-api-python-client is set up correctly.'使用recognize_google_cloud时，尽管我已经安装了

浏览 0提问于2019-04-15得票数 0

3回答

语音到文本从自己的声音文件

、、、

正如您可能知道的，使用Android API实现语音到文本转换非常简单。您所要做的就是调用API的意图，它将为您返回文本。speech- to -text API允许上传您自己要处理的声音文件吗？或者这是不可能的？

浏览 0提问于2011-08-09得票数 14

回答已采纳

1回答

Google语音API -在Python中证书验证失败

、、

我正在使用SpeechRecognition库。import speech_recognition as sr GOOGLE_CLOUD_SPEECH_CREDENTIALSAUDIO_FILE) as source: print('Starting re

浏览 0提问于2018-05-15得票数 0

1回答

匹配Google Cloud Speech API中所说的短语

对于Google Cloud Speech API，有没有一种方法可以传递一个单词或完整的句子，并确定该单词或句子是否与音频文件中具有置信度得分的单词或句子相同？例如，我是否可以传递一个音频文件和单词“奶酪”，并得到一个响应，告诉我音频文件是否说“奶酪”，以及API的置信度是什么？(传递句子和音频文件的想法相同。)如果Google不这样做，有没有其他的speech API可以这样做？谢谢!

浏览 1提问于2018-03-23得票数 0

1回答

来自wav文件或经过处理的原始音频缓冲区的语音识别

、

我需要将处理后的音频缓冲区转换为文本，或者在音频缓冲区文件保存为wave文件后，我可以使用googles离线语音到文本选项将wav转换为文本。请让我知道我该怎么做。

浏览 2提问于2017-11-20得票数 1

0回答

并不是所有的语音文件都能从Google Speech to Text API for Node.js输出

、

我正在使用下面的Node.js脚本片段，var google_speech = require('google-speech'); lang: 'en_US',

浏览 4提问于2016-07-12得票数 0

2回答

如何将colab中的音频文件转换为文本？

、

我正在尝试使用语音识别模块将colab工作区中的音频文件转换为文本。但是它不起作用，因为这里的音频参数需要是音频的，我如何将音频文件"audio.wav“加载到某个变量中以传递给它，或者只是简单地传递该文件。import speech_recognition as srtext = r.recognize_google(audio, language = 'en-IN

浏览 25提问于2021-07-29得票数 0

回答已采纳

1回答

无法从Google文本到语音api获得结果，同时从web流音频

、、、、

我想从网络上传输音频，并使用Python将其转换为文本。我已经将它集成到了Django通道代码中。我试过的是： from google.cloud

浏览 0提问于2019-05-09得票数 34

2回答

使用React Native的Google Cloud speech

、、

我正在尝试使用Google Cloud Speech API，这样我就可以传递音频文件并接收翻译后的文本，但我坚持使用集成。我已经有了api密钥和所有需要的东西，但是找不到如何在react原生中使用它。在文档中只有对node.js的解释(来自javascript部分)。此外，有几个库已经过时或只支持一个操作系统。文档中的node.js示例： // Imports the Google Cloud client li

浏览 3提问于2017-02-27得票数 5

点击加载更多