腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
API
是否
提供
了
转录
的
语言
代码
?
我计划
转录
一个未知
语言
的
演讲,所以我试图自动检测给定
了
多个
语言
代码
的
语言
,但是,我似乎找不到一个选项来实际找出
转录
将采用哪种
语言
。我浏览
了
speech- to -text
api
的
开发页面,但似乎找不到一种方法来输出
转录
文本
的
语言
代码
。 有人能帮我吗?谢谢。
浏览 31
提问于2020-04-14
得票数 0
1
回答
当使用google与"alternativeLanguageCodes“一起使用文本
API
时,接收使用过
的
语言
因此,我运行一个语音
转录
,并
提供
一些alternativeLanguageCodes,除了主要
的
languageCodelanguageCode: "en"Google语音自动地返回给我一个
转录
,其中
的
信心足够高,它可能实际上是正确
的
,音频文件
的
说话人发言。太棒
了
! 但是..。我还想知道它实际使用
的
浏览 0
提问于2020-10-29
得票数 0
回答已采纳
1
回答
哪种
语言
无法识别的语音
转录
方法?
我正在尝试建立一个软件,可以识别正在说
的
语言
。我
的
计划是使用谷歌
的
云语音到文本来
转录
演讲,并将其通过云翻译
api
来检测
转录
的
语言
。然而,因为语音转文本需要在
转录
之前设置
语言
代码
,所以我计划用不同
的
语言
集多次运行它,并比较“置信度”值以找到最有信心
的
转录
,这将通过云翻译
api
。 这是不是最理想<
浏览 2
提问于2020-04-14
得票数 0
2
回答
语音到文本
的
大型音频文件(Microsoft语音
API
)
、
、
、
、
使用Microsoft语音
API
转录
中/大型音频文件
的
最佳方法是什么,每个文件6~10分钟?比如批处理音频文件
的
转录
?顺便说一句,我认为Bing语音
API
和新
的
语音服务
API
没有什么区别
浏览 1
提问于2018-06-11
得票数 4
回答已采纳
1
回答
AT& Text :对文本自定义邮报
的
演讲
当我查看Developer.ATT.com上
的
文档时,我看到了应该使用
的
格式(
代码
)示例:Host:
api
.att.comX-SpeechContext: GrammarList Accept: applicationaudio/amr
浏览 4
提问于2015-05-26
得票数 0
回答已采纳
1
回答
Google Translate
API
中
的
转录
有没有可能获得Google
API
翻译
的
word
的
转录
?看这张图,第二个红色箭头指向单词“
转录
”
的
转录
。
浏览 18
提问于2017-02-27
得票数 1
回答已采纳
1
回答
不同用户
的
外语语音识别结果千差万别
、
、
、
这是一场演讲集中
的
游戏。我使用谷歌Chrome
的
实现,因为它是免费
的
,似乎很棒。B人说lo siento
转录
为lo síento,C人说
转录
为lo
浏览 2
提问于2019-09-06
得票数 0
1
回答
python aws sdk缺少
转录
流
API
、
、
我检查
了
github
代码
中
的
转录
流选项,看起来在文档和配置文件中都没有提到
转录
流:src/botocore/botocore/data/transcribe/2017-10-26/service-2.但是我看到了Ruby
的
文档:https://docs.aws.amazon.com/sdk-for-ruby/v3/
api
/Aws/Transc
浏览 25
提问于2020-03-20
得票数 2
2
回答
使用CMU
的
sphinx4来
转录
非数字数据
、
、
、
我最近
的
工作是使用CMU
的
sphinx4进行
转录
,并最终强制对齐,即使音频与其记录对齐。因此,我想使用sphinx4并自己动手。我使用狮身人面像
的
Transcriber.jar文件成功地
转录
了一个wav文件。但我无法让它工作在一个没有数字数据
的
音频中。页面声明“希望
浏览 2
提问于2011-08-11
得票数 4
1
回答
google speech
api
是否
处理双语音频流
可以从使用两种
语言
的
音频流中获取文本吗?例如,一段录音中,一个人说法语,另一个人把它翻译成英语。
浏览 0
提问于2017-05-31
得票数 1
1
回答
在AWS - ModelSettings错误中使用自定义
语言
模型(python
API
)
转录
、
、
我正在尝试
转录
使用Python
API
的
自定义
语言
模型
的
语音。我遵循
了
AWS网页上
提供
的
示例脚本。但是,它会抛出以下错误,说明它不支持ModelSettings下
的
'LanguageModelName‘参数。ParamValidationError:参数验证失败:输入中
的
未知参数:"ModelSettings",必须是以下之一: TranscriptionJobName、Language
浏览 20
提问于2021-04-28
得票数 0
0
回答
Azure Speech
API
语言
、
、
、
我已经使用Azure Speech
API
在网页上实现
了
聊天,可以使用语音转文本。它工作得很好,但我不知道在哪里可以设置
API
所理解
的
语言
。我希望它能理解法语,但当我用法语说话时,它会用熟悉
的
发音
转录
成英语单词。如何/在何处设置
语言
?我准确地说,我不是在Azure仪表板上设置服务的人。
浏览 7
提问于2018-07-12
得票数 0
回答已采纳
1
回答
亚马逊
转录
音频输入流
、
一些
提供
商,如谷歌,允许将音频流发送到他们
的
服务器,并在音频处理后立即获得结果。你知道
是否
有可能实现这一目标?
浏览 5
提问于2018-07-26
得票数 0
1
回答
Google支持不起作用
、
我在这里找到了这个项目,并试用了其中
的
样本。一切正常,但我找不到alternativeLanguageCodes
的
样本。我发现在版本V1P1Beta1中支持它,如这里所提到
的
:,如果我们使用alternativeLanguageCodes,
api
将尝试将音频
转录
到最相关
的
语言
。我观察到
的
是,它总是
转录
成languageCode中指定
的
语言
。 有人有机会尝试这个
API
吗?如果是这样的
浏览 0
提问于2018-07-31
得票数 1
1
回答
YouTube
的
自动字幕比产生了更好
的
效果(模型:视频,UseEnhanced: true)。这怎么可能?
、
、
、
、
这里我
的
谷歌语音设置给AI发短信以下是语音到文本AI:
的
输出文件这是视频链接:Google to Text
的
SRT (由YouTube分配
的
时间):例如
浏览 5
提问于2020-10-12
得票数 4
1
回答
是否
可以将numpy数组和采样率发送到microsoft speech- to -text,而不是将其保存到wav文件?
、
、
我使用Microsoft Cognitive Services speech-to-text python
API
进行
转录
。现在,我正在通过web
API
获取声音(使用这里
的
麦克风部分:https://ricardodeazambuja.com/deep_learning/2019/03/09/audio_and_video_google_colab/),然后我将声音写入'sound.wav‘,然后将'sound.wav’发
浏览 36
提问于2020-10-12
得票数 0
回答已采纳
1
回答
认知批量
转录
情感分析
、
、
、
当使用Azures批量
转录
服务(“
api
/ true /v2.0/
转录
/”)时,我可以通过将"AddSentiment“属性设置为true来获得句子级别的情感分析。然而,结果并不像文本分析
API
那样包含对整个文档
的
情感分析。
是否
有添加文档级情感评分
的
标志?我可以自己计算,但是我想如果
API
提供
这个特性就好了:https://docs.microsoft.com
浏览 15
提问于2020-08-31
得票数 0
回答已采纳
2
回答
批量
转录
和LUIS集成
、
、
我需要在批量
转录
和LUIS之间进行集成,其中我将把
转录
作为这样
的
方式传递给LUIS,并获得音频
的
意图。 据我所知,我们可以将用于意图分析
的
数据作为一个只接受500个字符
的
查询传递给LUIS。因此,问题来了,
是否
有可能将完整
的
从语音到文本
的
转录
批量
转录
API
传递给LUIS进行意图分析,或者我们必须将数据分块
提供
给LUIS?如果我们以块(500个字符)
的</e
浏览 20
提问于2020-06-11
得票数 3
2
回答
用于搜索视频内容
的
API
、
、
、
我想知道通过指定文本查询(就像一样)可以在视频存档中进行搜索
的
接口。
浏览 1
提问于2013-06-05
得票数 0
回答已采纳
1
回答
颤振::我可以用语音来文字
api
而不用发音校正吗?
、
、
我正在制作一个应用程序,使用给
api
发短信。由于使用,我觉得这个
api
没有将确切
的
发音转换为文本,而是纠正
了
发音并将其转换为文本。 例如,如果我发音'opple',文本将自动转换为'apple‘。有没有任何方法可以使用语音到文本
api
,没有一个功能,以纠正发音?
浏览 2
提问于2021-09-15
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券