Google Speech to Text API无法处理超过一分钟的音频文件

文章/答案/技术大牛

发布

1回答

Google Cloud speech API中转录的文件大小

、、、、

Google Cloud Speech API希望你对运行时间不到一分钟的音频文件使用，如果音频文件超过一分钟则使用。我如何分析使用哪个接口来获取文本，我们应该根据音频文件大小进行分析吗？或者如何找到音频转录的总时间，或者如何处理这种情况？

浏览 68提问于2018-02-09得票数 1

2回答

、

我正在尝试使用Google Speech to Text API转换具有以下属性的音频文件我使用以下Python代码来获取文本文件service_request = service.speech().asyncrecognize( 'config': {}) response = service_request

浏览 24提问于2017-01-15得票数 0

1回答

Google v1beta1 (合并和异步认知API调用)

、

Question1 (合并案件)：如何提高信心水平产出？我尝试了大容量的音频文件(超过一分钟运行文件)。本例使用了API调用。https://speech.goog

浏览 1提问于2016-07-27得票数 3

1回答

在google speech API的google存储桶中找不到音频文件

、

使用Google Speech API (使用python示例代码)，当超过1分钟时，您需要将音频文件放在google云上。根据一些示例代码，您可以使用像gs://python-docs-samples-tests/speech/audio.flac这样的路径。所以我把我的音频文件放在一个bucket中，并使用(我相信)正确的路径(即gs:/

浏览 4提问于2018-12-14得票数 0

1回答

如何使用google convert将语音转换为基于印度口音的文本

、、、、

我正在尝试使用google could APIs转换语音到文本，像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US，这段代码，我能够转换完美，文本是基于音频的US，口音或UK。：这里我上传(.wav)音频文件，并转换为文本。有人能帮上忙吗？桑迪普。

浏览 11提问于2021-07-09得票数 0

3回答

谷歌云语音转文本(MP3 to text)

、、

我正在使用Google Cloud Platform Speech-to-Text API试用帐户服务。我无法从音频文件中获取文本。我不知道确切的编码和采样率赫兹我应该使用的MP3文件的比特率128kbps。我尝试了各种选项，但我没有得到转录。const speech = require('@google-cloud/speech'); const

浏览 0提问于2017-12-15得票数 3

1回答

如何在nodejs上连接/连接音频缓冲区数组(文本到语音结果)？

、

我想将多个文本转换成一个音频，但我很困惑如何将多个音频连接到单个音频文件中(由于5k字符/请求限制，无法将长文本转换为音频)。 const promises = ['hi','world'].ma

浏览 0提问于2021-11-03得票数 0

回答已采纳

1回答

不转换超过10秒的音频(wav)文件

正在获得结果，但它仅将10秒的音频转换为文本，不会超过我尝试处理不同音频文件的时间r = sr.Recognizer() audio = r.record(source) s = r.recognize_google(audio).count(60)print(&qu

浏览 20提问于2019-07-25得票数 1

3回答

语音到文本从自己的声音文件

、、、

正如您可能知道的，使用Android API实现语音到文本转换非常简单。您所要做的就是调用API的意图，它将为您返回文本。我的情况有点不同，我有一个预先录制的3GPP声音文件，这是我从用户那里录制的，并保存在SD卡上。我想知道是否有可能像任何其他语音识别一样将其转录成文本。speech- to -text API允许上传您自己要处理的声音文件吗？或者这是不可能<e

浏览 0提问于2011-08-09得票数 14

回答已采纳

0回答

使用音频文件测试Google Speech API

、、、

我想看看Google Speech API是否对我的目的足够准确。我有一个音频文件，我想测试它，但在主页上的演示只允许您从麦克风录制。有没有一种方法可以在不学习API的情况下用音频文件测试Google的语音处理？

浏览 1提问于2017-06-13得票数 2

1回答

使用API和网站Google speech to text不同的结果

我一直在使用Google speech- to -text API来转录音频。最近，我在上尝试了一些音频文件，得到了不同的结果。你知道为什么会出现这种情况吗？谷歌在使用网站时会在幕后进行一些预处理吗？

浏览 0提问于2020-02-11得票数 0

2回答

Google speech to text api / Google cloud speech解决方案中的用户数据隐私

、

当我使用Google speech to text api或google cloud speech solution时，数据隐私保持在什么级别。我想知道这一点，因为我正在开发一个将音频文件转换为文本的应用程序，这些文件可能包含用户敏感数据。

浏览 1提问于2017-06-16得票数 13

1回答

无法从Google文本到语音api获得结果，同时从web流音频

、、、、

现在，说到问题，我没有得到任何异常或错误，但我没有从google得到任何结果。 from google.cloud import s

浏览 0提问于2019-05-09得票数 34

1回答

使用Google* Cloud API python示例异步记录代码时出现属性错误*

、、

代码链接：我正在使用Google Speech API中的示例python代码将长(超过1分钟)的音频文件从语音转换为文本。我如何在PyCharm中运行代码，以便它转换我的音频文件(以wave格式)为文本使用我创建的API键(为我的帐户)，而不会得到'NoneType‘错误？我将音频文件的路径直接添加到代码中(第73行)。我还在&#

浏览 8提问于2019-07-09得票数 1

回答已采纳

1回答

所以我有一个用例，我想要将音频文件(.WAV)上传到一个blob存储中，它会触发一个函数并从音频中获取文本。目前，唯一可能的方法是将音频文件放在本地。音频配置无法获取音频文件的uri。我使用的代码是这样的： import azure.cognitiveservices.speech as speechsdk speech_key, service_region = "sub-key", &quo

浏览 39提问于2021-08-09得票数 0

1回答

无法在上找到文件:错误404

、、、、

我使用python库进行请求，并在GCP上有一个存储音频文件并使异步requests.Below成为用于发出请求的python代码的桶。from google.cloud import storage from google.cloud.speechresponse = operation.result(timeout=450)

浏览 0提问于2018-02-20得票数 6

回答已采纳

1回答

Google Speech API -有没有办法确定音频是否有人声？

、、、、

我正在制作一个音频过滤应用程序，可以读取超过数百个音频文件并对其进行过滤。因此，如果音频中有人类的声音，它将接受它，如果它不接受，它将删除音频文件。我使用ffmpeg来获取音频的细节，并添加其他过滤器，如大小、持续时间和静音(尽管它在检测所有音频文件的静音时不是很准确)。我的公司要求我尝试使用Google Cloud Speech API来检测音频中是否有人类的声音。有了这段代码

浏览 4提问于2019-11-16得票数 1

1回答

Google :配额组的标记不足

、、、

当我试图处理一个10分钟的音频文件时，我得到了以下错误。我刚刚开始使用Google产品，所以我是唯一访问这个资源的人。我怎么会超过配额呢？配额是按其默认值设定的，我认为我并没有接近这个限额。音频文件(22 is )存储在存储桶中，并通过uri音频源访问，否则演示代码不变。 File "/Users/kev

浏览 5提问于2017-02-10得票数 1

回答已采纳

1回答

使用Google* Speech *API的异步请求的curl命令

、

现在Google Speech API不再是beta版本，我的curl命令需要更新，但speech: longer的文档显示为404。我需要发出一个异步请求，因为我的文件超过了一分钟。在此之前，我使用的是： curl -s -k -H "Content-Type: application/json" \-H "Authorization: Bearer xxxxxxx

浏览 2提问于2017-05-04得票数 1

3回答

如何在AWS Lambda中直接导入Google模块？

、

我正在尝试通过Lambda函数处理来自我的S3的音频文件，该函数应该调用google speech api来将该文件转换为语音到文本。然而，似乎Lambda并没有安装这个模块。import array as arrfrom botocore.vendored import requestsimport urllibf

浏览 46提问于2019-01-18得票数 2

点击加载更多

Google Cloud speech API中转录的文件大小