我正在尝试使用google could APIs转换语音到文本,像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US,这段代码,我能够转换完美,文本是基于音频的US,口音或UK。:这里我上传(.wav)音频文件,并转换为文本。有人能帮上忙吗?桑迪普。
正如您可能知道的,使用Android API实现语音到文本转换非常简单。您所要做的就是调用API的意图,它将为您返回文本。我的情况有点不同,我有一个预先录制的3GPP声音文件,这是我从用户那里录制的,并保存在SD卡上。我想知道是否有可能像任何其他语音识别一样将其转录成文本。speech- to -textAPI允许上传您自己要处理的声音文件吗?或者这是不可能<e
当我试图处理一个10分钟的音频文件时,我得到了以下错误。我刚刚开始使用Google产品,所以我是唯一访问这个资源的人。我怎么会超过配额呢?配额是按其默认值设定的,我认为我并没有接近这个限额。音频文件(22 is )存储在存储桶中,并通过uri音频源访问,否则演示代码不变。 File "/Users/kev