API是否提供了转录的语言代码？

文章/答案/技术大牛

发布

1回答

我计划转录一个未知语言的演讲，所以我试图自动检测给定了多个语言代码的语言，但是，我似乎找不到一个选项来实际找出转录将采用哪种语言。我浏览了speech- to -text api的开发页面，但似乎找不到一种方法来输出转录文本的语言代码。有人能帮我吗？谢谢。

浏览 31提问于2020-04-14得票数 0

1回答

当使用google与"alternativeLanguageCodes“一起使用文本API时，接收使用过的语言

因此，我运行一个语音转录，并提供一些alternativeLanguageCodes，除了主要的languageCodelanguageCode: "en"Google语音自动地返回给我一个转录，其中的信心足够高，它可能实际上是正确的，音频文件的说话人发言。太棒了！但是..。我还想知道它实际使用的

浏览 0提问于2020-10-29得票数 0

回答已采纳

1回答

哪种语言无法识别的语音转录方法？

我正在尝试建立一个软件，可以识别正在说的语言。我的计划是使用谷歌的云语音到文本来转录演讲，并将其通过云翻译api来检测转录的语言。然而，因为语音转文本需要在转录之前设置语言代码，所以我计划用不同的语言集多次运行它，并比较“置信度”值以找到最有信心的转录，这将通过云翻译api。这是不是最理想<

浏览 2提问于2020-04-14得票数 0

2回答

语音到文本的大型音频文件(Microsoft语音API)

、、、、

使用Microsoft语音API转录中/大型音频文件的最佳方法是什么，每个文件6~10分钟？比如批处理音频文件的转录？顺便说一句，我认为Bing语音API和新的语音服务API没有什么区别

浏览 1提问于2018-06-11得票数 4

回答已采纳

1回答

AT& Text :对文本自定义邮报的演讲

当我查看Developer.ATT.com上的文档时，我看到了应该使用的格式(代码)示例：Host: api.att.comX-SpeechContext: GrammarList Accept: applicationaudio/amr

浏览 4提问于2015-05-26得票数 0

回答已采纳

1回答

Google Translate API中的转录

有没有可能获得Google API翻译的word的转录？看这张图，第二个红色箭头指向单词“转录”的转录。 

浏览 18提问于2017-02-27得票数 1

回答已采纳

1回答

不同用户的外语语音识别结果千差万别

、、、

这是一场演讲集中的游戏。我使用谷歌Chrome的实现，因为它是免费的，似乎很棒。B人说lo siento转录为lo síento，C人说转录为lo

浏览 2提问于2019-09-06得票数 0

1回答

python aws sdk缺少转录流API

、、

我检查了github代码中的转录流选项，看起来在文档和配置文件中都没有提到转录流：src/botocore/botocore/data/transcribe/2017-10-26/service-2.但是我看到了Ruby的文档：https://docs.aws.amazon.com/sdk-for-ruby/v3/api/Aws/Transc

浏览 25提问于2020-03-20得票数 2

2回答

使用CMU的sphinx4来转录非数字数据

、、、

我最近的工作是使用CMU的sphinx4进行转录，并最终强制对齐，即使音频与其记录对齐。因此，我想使用sphinx4并自己动手。我使用狮身人面像的Transcriber.jar文件成功地转录了一个wav文件。但我无法让它工作在一个没有数字数据的音频中。页面声明“希望

浏览 2提问于2011-08-11得票数 4

1回答

google speech api是否处理双语音频流

可以从使用两种语言的音频流中获取文本吗？例如，一段录音中，一个人说法语，另一个人把它翻译成英语。

浏览 0提问于2017-05-31得票数 1

1回答

在AWS - ModelSettings错误中使用自定义语言模型(python API)转录

、、

我正在尝试转录使用Python API的自定义语言模型的语音。我遵循了AWS网页上提供的示例脚本。但是，它会抛出以下错误，说明它不支持ModelSettings下的'LanguageModelName‘参数。ParamValidationError:参数验证失败:输入中的未知参数："ModelSettings"，必须是以下之一: TranscriptionJobName、Language

浏览 20提问于2021-04-28得票数 0

0回答

Azure Speech API语言

、、、

我已经使用Azure Speech API在网页上实现了聊天，可以使用语音转文本。它工作得很好，但我不知道在哪里可以设置API所理解的语言。我希望它能理解法语，但当我用法语说话时，它会用熟悉的发音转录成英语单词。如何/在何处设置语言？我准确地说，我不是在Azure仪表板上设置服务的人。

浏览 7提问于2018-07-12得票数 0

回答已采纳

1回答

亚马逊转录音频输入流

、

一些提供商，如谷歌，允许将音频流发送到他们的服务器，并在音频处理后立即获得结果。你知道是否有可能实现这一目标？

浏览 5提问于2018-07-26得票数 0

1回答

Google支持不起作用

、

我在这里找到了这个项目，并试用了其中的样本。一切正常，但我找不到alternativeLanguageCodes的样本。我发现在版本V1P1Beta1中支持它，如这里所提到的：，如果我们使用alternativeLanguageCodes，api将尝试将音频转录到最相关的语言。我观察到的是，它总是转录成languageCode中指定的语言。有人有机会尝试这个API吗？如果是这样的

浏览 0提问于2018-07-31得票数 1

1回答

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

、、、、

这里我的谷歌语音设置给AI发短信以下是语音到文本AI：的输出文件这是视频链接：Google to Text的SRT (由YouTube分配的时间)：例如

浏览 5提问于2020-10-12得票数 4

1回答

是否可以将numpy数组和采样率发送到microsoft speech- to -text，而不是将其保存到wav文件？

、、

我使用Microsoft Cognitive Services speech-to-text python API进行转录。现在，我正在通过web API获取声音(使用这里的麦克风部分：https://ricardodeazambuja.com/deep_learning/2019/03/09/audio_and_video_google_colab/)，然后我将声音写入'sound.wav‘，然后将'sound.wav’发

浏览 36提问于2020-10-12得票数 0

回答已采纳

1回答

认知批量转录情感分析

、、、

当使用Azures批量转录服务(“api/ true /v2.0/转录/”)时，我可以通过将"AddSentiment“属性设置为true来获得句子级别的情感分析。然而，结果并不像文本分析API那样包含对整个文档的情感分析。是否有添加文档级情感评分的标志？我可以自己计算，但是我想如果API提供这个特性就好了：https://docs.microsoft.com&#

浏览 15提问于2020-08-31得票数 0

回答已采纳

2回答

批量转录和LUIS集成

、、

我需要在批量转录和LUIS之间进行集成，其中我将把转录作为这样的方式传递给LUIS，并获得音频的意图。据我所知，我们可以将用于意图分析的数据作为一个只接受500个字符的查询传递给LUIS。因此，问题来了，是否有可能将完整的从语音到文本的转录批量转录API传递给LUIS进行意图分析，或者我们必须将数据分块提供给LUIS？如果我们以块(500个字符)的</e

浏览 20提问于2020-06-11得票数 3

2回答

用于搜索视频内容的API

、、、

我想知道通过指定文本查询(就像一样)可以在视频存档中进行搜索的接口。

浏览 1提问于2013-06-05得票数 0

回答已采纳

1回答

颤振：：我可以用语音来文字api而不用发音校正吗？

、、

我正在制作一个应用程序，使用给api发短信。由于使用，我觉得这个api没有将确切的发音转换为文本，而是纠正了发音并将其转换为文本。例如，如果我发音'opple'，文本将自动转换为'apple‘。有没有任何方法可以使用语音到文本api，没有一个功能，以纠正发音？

浏览 2提问于2021-09-15得票数 0

回答已采纳

点击加载更多