Google Speech To Text API:启用未找到的单词置信度

文章/答案/技术大牛

发布

1回答

c#、google-api、speech-recognition、voice-recognition、google-speech-api

我无法将单词级别置信度添加到我的替代结果中，有人可以帮助我吗？我试着通读下面的页面：https://cloud.google.com/speech-to-text/docs/word-confidence#speech-word-level-confidence-python，但我不能修改我的代码来检索单词级别的置信度 Encoding = AudioEncoding

浏览 15提问于2019-06-05得票数 3

回答已采纳

1回答

如何在Google Speech API中显示单词级别的置信度分数

node.js、google-speech-api

我已经在Cloud Functions中包含了Google Speech API。我想获得单词级别的置信度分数，所以我将'enableWordConfidence‘设置为true。由于某些原因，响应不会返回单词级别的置信度分数。我尝试过使用de-DE和en-US作为languageCode，但两者都不起作用。这是来自Google的官方文档，但复制该代码并在云函数中运行它也不会返回单词级别的置信度<

浏览 6提问于2019-02-19得票数 0

回答已采纳

1回答

匹配Google* Cloud Speech *API中所说的短语

google-cloud-speech

对于Google Cloud Speech API，有没有一种方法可以传递一个单词或完整的句子，并确定该单词或句子是否与音频文件中具有置信度得分的单词或句子相同？例如，我是否可以传递一个音频文件和单词“奶酪”，并得到一个响应，告诉我音频文件是否说“奶酪”，以及API的置信度是什么？(传递句子和音频文件的想法相同。)我知道我可以传递有用的<

浏览 1提问于2018-03-23得票数 0

2回答

使用多个语音转文本API提高准确率

artificial-intelligence、speech-recognition、speech-to-text、ibm-watson、google-speech-api

有没有人尝试过使用两个或更多的speech to text API转录音频？您可以使用时间戳匹配单词，并以最高的置信度选择单词。如果有人这样做了，它是否显著提高了转录的准确性？值得吗？

浏览 20提问于2017-07-07得票数 3

2回答

node webkit text* to speech *api不工作？

javascript、webkit、node-webkit

我正在尝试建立一个节点webkit的应用程序，这是运行在铬浏览器和一些文本到语音的api是不能正常工作在节点webkit (windows)。

浏览 1提问于2015-02-05得票数 0

3回答

语音翻译-- Android

java、android、android-activity、google-translate

这意味着，我在用一种语言说话，另一端的人应该想把我的声音翻译成他们能理解的语言。我们可以在任何google api中做到这一点吗?或者推荐我，如果有其他api可以做到这一点的话。提前谢谢。

浏览 2提问于2015-05-20得票数 0

2回答

在转录Google* Speech *API中显示每个单词的置信度得分

google-speech-api

我正在尝试打印每个单词的置信度分数，而不是像目前显示的那样只打印整个句子。应该怎么做呢？Word: bye-bye., start_time: 1502.3, end_time: 1502.9我想知道每个单词的置信度分数

浏览 0提问于2018-06-12得票数 1

1回答

如何允许团队成员使用我的Google* Cloud Speech- to -Text *API帐户？

google-cloud-platform、google-iam、google-cloud-iam

我启用了Google Cloud Speech- to -Text API，但我希望允许团队成员在我的帐户上使用它。我进入IAM添加了一个新用户，但我没有看到任何与Cloud Speech- to -Text API相关的角色。我需要选择哪些IAM角色才能允许新团队成员访问API？

浏览 3提问于2021-01-14得票数 2

1回答

如何使用google* convert将语音转换为基于印度口音的文本*

google-cloud-platform、google-api、speech-to-text、google-speech-api、google-speech-to-text-api

我正在尝试使用google could APIs转换语音到文本，像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US，这段代码，我能够转换完美，文本是基于音频的US，口音或UK。如何通过google could API转换这个印度口音，我需要做哪些改变。谢谢桑迪普。

浏览 11提问于2021-07-09得票数 0

2回答

Python应用程序侦听关键字。(像Cortana)

python、speech-recognition、voice-recognition、cortana

我正在尝试做一个Python应用，它的行为就像Alexa，Cortana或者Google的"Ok，Google“。我想让它不断地监听特定的关键字。在它听到关键字后，我想让它执行一个函数。

浏览 3提问于2018-02-14得票数 1

1回答

cloud vision API的用于OCR的JSON响应的付费版本中缺少"Confidence“字段

google-cloud-ml、google-cloud-vision、vision-api

来自Vision API (https://cloud.google.com/vision/docs/drag-and-drop)免费版本的JSON响应具有名为“置信度”的字段，该字段显示了模型在单词级别和字符级别上的识别置信度{ "y": 26

浏览 11提问于2019-03-04得票数 0

3回答

谷歌Speech* - googleapiclient.errors.UnknownApiNameOrVersion:名称: speech版本: v1beta1*

python-3.x、google-api、speech-recognition、speech-to-text、google-speech-to-text-api

with open(service_auth_file) as f: print('completed the recognition')它需要一个名为GOOGLE_APPLICATION_CREDENTIAL的环境变量。所以我添加了一个包含以下数据的文件的位置(只提及JSON文件中

浏览 3提问于2020-03-04得票数 2

1回答

Google Cloud Vision是否包含(可能)后OCR文本校正？

microsoft-cognitive、google-cloud-vision

我在网上找这个问题的答案，但是找不到。我的意思是像自动纠正，或者不纠正，但建议更明显的单词。这个特性是Google cloud愿景的一部分，还是我应该使用一个外部程序来实现？我知道Google cloud vision还会告诉你一些关于讨论某个话题(医疗、暴力等)的可能性。它有一个内置的功能，可以在分析医疗文档时自动使用‘医学字典’吗？例如，当在医学文本中发现单词“miniscule”时，它是否会将其更改(或提议更改

浏览 1提问于2018-08-22得票数 0

2回答

如何从Google* Cloud text- to -speech *API获取SSML <mark>时间戳

markers、google-cloud-speech、google-text-to-speech、ssml

我想通过Google Cloud text- to -speech API使用来请求音频流中这些标记的计时。这些时间戳是必需的，以便向用户提供效果、单词/部分突出显示和反馈的提示。我发现是相关的，尽管问题指的是每个单词的时间戳，而不是SSML <mark>标记。下面的API请求返回OK，但显示缺少请求的标记数据。这是在使用Cloud <em

浏览 56提问于2019-08-07得票数 14

2回答

如何开启语音转文本接口的MP3编码功能

google-cloud-platform、speech-to-text

对于Google Cloud Speech-to-text api，支持MP3编码，但它还处于测试阶段。如下所述： https://cloud.google.com/speech-to-text/docs/encoding 当我尝试发送一个编码设置为MP3的请求时，我得到了一个错误响应Invalid value我是否必须在某个地方启用此测试版功能？如果是这样，我可以在哪里做到这一点？

浏览 19提问于2019-07-01得票数 0

回答已采纳

3回答

在C#中使用google* speech *API返回403错误

c#、http-status-code-403、google-speech-api

尝试在C#中使用Google Speech API时返回403。 { { FileStream fileStream = File.OpenRead("good-morning-google.flac/speech-api/v2/recognize?outpu

浏览 7提问于2016-08-25得票数 0

2回答

通过保留时间戳和静默，使用Google* Cloud API将音频转换为文本并再次使用音频*

google-cloud-platform、google-cloud-speech

我使用谷歌云API和转换音频到文本-文本必须有时间戳。将上述步骤1的输出发送到text to audio接口。我想发送上述生成的文本或JSON (从音频到文本API)，并转换我的文本到音频再次。音频应该保留时间戳，以便我可以得到相同的原始文件与中断，暂停，沉默与不同的声音。因此，如果我的原始文件是1分钟的持续时间，我想生成相同的1分钟不同声音的持续时间文件。所以，它应该保留我<em

浏览 2提问于2020-07-19得票数 1

1回答

Google Speech API调用

c#、vb.net、google-speech-api

我正在尝试在.net中使用Google Speech API v1，但在打电话时遇到了挑战。Dim response = userSpeech.Recognize(New RecognitionConfigAPI处于启用状态。Google Cloud凭证设置为环境变量。所以，这里没有问题。然后我在

浏览 3提问于2017-07-16得票数 0

回答已采纳

2回答

如何开始记录什么时候说的话，Python？

python、python-3.x、speech

有没有一种方法可以让你说一个短语(有点像Google)，让它开始识别Python 3中的语音？这是我的密码：r = sr.Recognizer() audio = r.listen(source) print("You said: " + r.recognize

浏览 0提问于2018-12-09得票数 2

回答已采纳

1回答

Azure Speech To Text API

ios、azure、speech-to-text、msdn、bing-speech

我喜欢Google Speech to Text API的一点是，它有惊人的准确性，在我的经验中比Azure API要好得多。原因是，我能够在我的请求中向Google API发送一个预期单词的列表，因此，增加了这些术语/短语出现的可能性。使用Azure，我只能创建语音模型。这样做的问题是，我必须为每个请求创建一个新模型

浏览 0提问于2018-05-22得票数 1

点击加载更多