如何将实时音频url传递到Google Speech to Text API

文章/答案/技术大牛

发布

3回答

python、speech-recognition、speech-to-text、google-speech-api

我有一个现场录音的网址，我正在尝试使用谷歌语音到文本API转录。我使用的是来自Cloud Speech to Text API的示例代码。然而，问题是，当我传递活动的url时，我没有收到任何输出。from google.cloud import speechfrom google.cloud.sp

浏览 19提问于2019-08-09得票数 3

回答已采纳

1回答

录制的音频/webm作为Google* Speech- to -Text *API的输入

java、speech-to-text、google-speech-api

我使用React-Mic录制音频，将音频传递给FormData，并将包含该FormData的HTTP post请求发送到我的Java服务器。但是，由于录制的音频是webm格式的，因此没有适用于Google Speech-To-Text API的编码。知道如何将音频转换为flac或Google Speech- to -Text API支持的任何其他

浏览 2提问于2019-07-10得票数 2

1回答

Android Speech* to Text API (Recognizer Intent)和Google Cloud Speech *API之间的区别？

android、google-cloud-speech

所以我正在考虑建立一个语音到文本的应用程序，以此为乐。我做了一些研究，发现了一个使用RecognizerIntent的内置语音到文本的API，这是免费的，但也发现谷歌现在提供的云语音API是收费的。

浏览 0提问于2016-12-01得票数 39

回答已采纳

2回答

如何将实时直播音频从麦克风转换为文本？

python、speech-recognition、speech-to-text、google-speech-api

我需要建立一个语音到文本转换器使用Python和谷歌语音到文本API。我想要像这个例子一样实时地做这件事。到目前为止，我已经尝试了以下代码：import pyaudio print("Running")audio=r.listen(source)try: print("Analyzing voice dat

浏览 0提问于2019-07-30得票数 1

1回答

如何使用google* convert将语音转换为基于印度口音的文本*

google-cloud-platform、google-api、speech-to-text、google-speech-api、google-speech-to-text-api

我正在尝试使用google could APIs转换语音到文本，像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US，这段代码，我能够转换完美，文本是基于音频的US，口音或UK。：这里我上传(.wav)音频文件，并转换为文本。有人能帮上忙吗？桑迪普。

浏览 11提问于2021-07-09得票数 0

1回答

Google-speech-api抛出EOF错误，而不是执行音频转录

go、websocket、google-speech-api、dialplan、asterisk-ari

在我的项目中，我在golang开发了一个websocket服务器，它通过ARI控制asterisk频道，并使用google-speech-api在同一频道上执行实时音频转录。在连接时，我想保存音频从一个星号频道到文件，同时发送音频到谷歌，并获得文字记录。音频是由asterisk audiofork应用程序发送的，这样我就可以使用ARI操纵频道，而音频则在另一个线程上流式传输。问题是，当我发送帧<em

浏览 73提问于2021-10-07得票数 0

回答已采纳

2回答

使用电子公司的gRPC实时转录Google Cloud Speech API

javascript、google-cloud-platform、electron

我想要实现的是与Web Speech API相同的实时脚本过程，但使用的是Google Cloud Speech API。这是我实现的内容的简化版本：const speech = require('@google-cloud/speech'); const client

浏览 2提问于2017-11-01得票数 11

1回答

如何在不保存到文件的情况下收听IBM Watson Text* to Speech结果(python)*

python、ibm-cloud、text-to-speech、ibm-watson、watson-text-to-speech

我正在编写一个简单的python程序，该程序获取一个文本文件，然后使用IBM Watson text To Speech将其转换为音频，然后使用playsound等模块直接播放音频。大多数教程只向您展示了如何将结果保存到文件中，而不是如何将其传递给播放音频的模块 from ibm_watson import TextToSpeechV1 from ibm_cloud_sdk_core.authenticatorsimport IAMAuthentica

浏览 47提问于2019-12-18得票数 1

回答已采纳

1回答

用python将声音从网站转换为文本

python

如何将声音从网站转换为文本？当我点击一个网站的按钮是播放一个声音，但我的问题是如何将它转换成一个文本，而不使用麦克风，只使用网站和蟒蛇。import speech_recognition as sr with sr.AudioFile('my.wav') as source: text = r.recognize_google</em

浏览 1提问于2020-05-14得票数 2

回答已采纳

2回答

如何将colab中的音频文件转换为文本？

python-3.x、google-colaboratory

我正在尝试使用语音识别模块将colab工作区中的音频文件转换为文本。但是它不起作用，因为这里的音频参数需要是音频的，我如何将音频文件"audio.wav“加载到某个变量中以传递给它，或者只是简单地传递该文件。import speech_recognition as srtext = r.recognize_google(audio, language = '

浏览 25提问于2021-07-29得票数 0

回答已采纳

1回答

从Google语音识别中删除脏话审查器

ios、xcode、speech-recognition、profanity

我正在尝试使用谷歌的speech to text API在iOS应用程序中将语音转换为文本。我只是简单地发送一些音频数据到网址"“，它返回给我(大部分)正确的话我说。然而，它正在用‘#’替换任何亵渎。如何将“####”替换为实际的脏话？NSURL *url = [NSURL URLWithString:@"https://www.g

浏览 6提问于2013-02-23得票数 3

回答已采纳

1回答

是否有可能在不编写新文件的情况下将文本合成为语音？

python-3.x、google-cloud-platform、text-to-speech、google-text-to-speech

我想使用GCP Text- to -Speech API来合成文本到语音，几乎我能找到的每个例子都会写一个新文件，我想在函数输入文本并通过计算机扬声器读取它的时候这样做。texttospeech.TextToSpeechClient(credentials=credentials) audio_encoding=text

浏览 18提问于2019-10-10得票数 1

回答已采纳

1回答

谷歌语音转录

google-cloud-platform、google-speech-api、transcription

如果Google Speech API近乎实时地转录音频，而我到实际服务器的延迟只有50ms，为什么我会在1.6s之后收到最终的流式转录结果？难道我不应该在几百毫秒内收到它吗？

浏览 4提问于2018-10-16得票数 0

1回答

如何用javascript axios转换这个curl请求？

javascript、curl、axios、google-speech-api

我想对Google语音API执行一个请求，以返回我发送给API的音频的翻译。如果我使用下面的curl命令，我成功地检索了数据，但是我不知道如何将它传递给Axios请求。application-default print-access-token) -H "Content-Type: application/json; charset=utf-8" "https://speech.googleapis.com&

浏览 0提问于2019-05-13得票数 0

回答已采纳

2回答

如何在ionic中将录音实时流式传输到Firebase？

typescript、cordova、ionic-framework、cordova-plugins、media

我正在尝试通过使用Ionic作为前端的Google API服务来实现实时语音到文本的识别。我找不到一个库，可以从离子记录和流记录实时存储在google存储桶中。你有什么意见建议？

浏览 2提问于2020-06-01得票数 4

3回答

语音到文本从自己的声音文件

android、file、audio、speech-to-text

正如您可能知道的，使用Android API实现语音到文本转换非常简单。您所要做的就是调用API的意图，它将为您返回文本。speech- to -text API允许上传您自己要处理的声音文件吗？或者这是不可能的？

浏览 0提问于2011-08-09得票数 14

回答已采纳

1回答

C# -沃森-文字API演讲

c#、api、speech-recognition、speech-to-text、watson

我正在尝试在C# windows应用程序中创建一个windows应用程序，该应用程序应该使用IBM服务来执行语音到文本的转换。如何实现IBM语音到text服务，该服务应该倾听用户的声音并编写输出文本。我搜索了许多文章，在所有这些例子中，.wav (音频)文件被作为输入传递，输出文本被写入。我试图执行这个演讲，以更实时地文本，而不是传递一个现有的或存储的音频(.wav)文件。使用Microsoft.Speech可以使用recogniz

浏览 4提问于2017-06-15得票数 0

1回答

将python生成的音频数据发送给Google* Cloud语音到文本以进行异步识别*

python、google-cloud-speech、python-sounddevice

我正在编写一个脚本，将数据从麦克风发送到Google语音到文本API。我需要访问gRPC API来产生在录制过程中的实时读数。一旦记录完成，我需要访问REST以获得更精确的异步识别。但是，仅像我在实时识别中那样发送字节字符串似乎不起作用： config= speech.Recogn

浏览 32提问于2021-12-31得票数 1

回答已采纳

3回答

在nodejs中将音频从url转换为base64？

javascript、node.js、facebook、audio、base64

我想发送一个语音剪辑到facebook messenger，并使用Google Cloud Speech to text将其转换为文本。然而，facebook messenger格式设置了文件的url，我不知道如何将其转换为base64。如果是像.png和.jpg这样的镜像，也没问题，有相应的包。但我正在尝试转换音频，如.mp3和.m4a文件。有没有什么工具可以和nodejs一起使用。我不喜欢将音频文件保存为本地文件，因为我正在使用Google

浏览 58提问于2019-06-06得票数 0

1回答

Xamarin android应用程序中的SpeechRecognitionEngine

c#、android、xamarin、speech-recognition

我希望我的应用程序可以在任何时候侦听识别，但当我尝试在Xamarin中使用SpeechRecognitionEngine/SpeechSyntax时，我收到错误消息"Speech is not supported

浏览 0提问于2021-08-03得票数 1

点击加载更多