Google Chrome提供了语音转文本( speech to text,STT ),因此许多智能手机应用程序都提供了STT。它有很好的认知度。如果我使用GoogleSpeech来给Api发短信,这个问题就很容易解决了。
如果没有关于STT的公共googleapi,请告诉我除了使用start之外的其他方法。
我在谷歌语音识别中遇到了关于长音频文件的问题。所以我决定在15秒内拆分我的音频文件。每次我发送第一个15秒到语音识别,然后第二个15秒,以此类推… 但是现在当我使用pydub lib时,它分割音频文件,分割后的返回值不是文件扩展名,因为API需要一个文件扩展名作为参数(我标记了错误),key
# to use another API key, use `r.recognize_google(audio, key="GOOGLE_<
我试图使用Python3.x,jupyter notebook和SpeechRecognition库对一些音频文件执行语音识别,但我得到了:
'RequestError: missing google-api-python-clientmodule: ensure that google-api-python-client is set up correctly.'使用recognize_google_cloud时,尽管我已经安装了
我正在尝试使用语音识别模块将colab工作区中的音频文件转换为文本。但是它不起作用,因为这里的音频参数需要是音频的,我如何将音频文件"audio.wav“加载到某个变量中以传递给它,或者只是简单地传递该文件。import speech_recognition as srtext = r.recognize_google(audio, language = 'en-IN
我正在尝试使用Google Cloud SpeechAPI,这样我就可以传递音频文件并接收翻译后的文本,但我坚持使用集成。我已经有了api密钥和所有需要的东西,但是找不到如何在react原生中使用它。在文档中只有对node.js的解释(来自javascript部分)。此外,有几个库已经过时或只支持一个操作系统。文档中的node.js示例:
// Imports the Google Cloud client li