腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何在不获取麦克风权限的情况下重启webkitSpeechRecognition?
如果我停止
识别
并重新启动,它会再次要求麦克风许可。它是否有任何想法暂停
识别
,并在发言结束后继续?
浏览 7
提问于2019-04-20
得票数 0
1
回答
Google语音
API
现场
识别
、
、
、
我想知道是否有可能用这个rest进行某种livespeech
识别
。我可以提出一个单一的要求,但我想要流我的
音频
数据和处理结果随着时间的推移。
浏览 1
提问于2018-09-12
得票数 0
回答已采纳
2
回答
如何下载WordPress
音频
附件
、
、
我一直在搜索
高低
,试图找出如何创建下载链接的
音频
文件上传到一个帖子。 我知道如何将
音频
url直接显示到主题模板中,但是当它被点击时,它就会开始在浏览器中显示
音频
。
浏览 0
提问于2013-03-02
得票数 0
1
回答
能否向Azure说话人
识别
API
发送实时数据?
、
、
、
、
我使用Microsoft说话人
识别
API
来区分人们的声音。 或者,除了这个
API
,还有其他的方法吗?
浏览 4
提问于2018-01-14
得票数 1
3
回答
是否有可能将实时数据发送到Bing语音
识别
?
、
、
、
我正在编写一个应用程序,它应该接收
音频
,并将它发送到Bing
识别
API
以获取文本。我使用了服务库,它与wav文件一起工作。因此,我编写了自己的流类,以接收来自麦克风或网络(RTP)的
音频
,并将其发送到
识别
API
。当我在
音频
流前面添加一个WAV头时,它会工作几秒钟。调试表明,
识别
api
读取表单流的速度比由
音频
源填充的速度快(16k采样,16位,mono)。 因此,我的问题是:是否有一种方法来使用实时(连续)
音频
浏览 1
提问于2016-12-12
得票数 4
回答已采纳
1
回答
YouTube的自动字幕比产生了更好的效果(模型:视频,UseEnhanced: true)。这怎么可能?
、
、
、
、
这里我的谷歌语音设置给AI发短信以下是语音到文本AI:的输出文件这是视频链接: 这是提供给Google:的视频的
音频
文件。这是我用来提取视频
音频
的命令:ffmpeg -i "input.mkv" -af aformat=s16:48000:output.flac
浏览 5
提问于2020-10-12
得票数 4
1
回答
在mp3格式)从语音
识别
?
、
、
、
、
可能重复: 我在android上使用语音
识别
类,我成功地获得了语音
识别
。但我想要的是真实的语音数据,而不是文字,而不是文字。
浏览 1
提问于2012-11-04
得票数 3
1
回答
SpeechRecognitionEngine.setInputToDefaultAudioDevice() Microsoft.Speech方法投掷System.InvalidOperationException
、
我正在尝试将
音频
流的输入设置为麦克风,这是默认的
音频
设备,但它正在抛出异常: 感谢你的帮助!
浏览 1
提问于2015-10-24
得票数 3
1
回答
沃森在python中用"interim_results = True“对文本的讲话给出了ValueError
、
当使用Python使用沃森语音到文本服务时,设置interim_results = True时每次都会出现以下错误: raise ValueError(errmsg("Extra data", s, end, len(s)))我使用一个大约6秒长的.wav文件运行它(
浏览 4
提问于2017-07-31
得票数 0
回答已采纳
1
回答
Google语音
API
流
我试图用合并方法将我的PBX连接到Google,但是由于我需要记录语音,将它发送到
API
,等待响应并将其处理回来,所以不可能进行正常的会话或尝试使用正常的会话/处理语音来进行实时服务。推荐其他
API
吗?或者是否有一种方式来设置VoIP/流到谷歌。类似于Alexa/Google。我没有找到对象的任何内容:
浏览 3
提问于2017-01-19
得票数 2
回答已采纳
1
回答
当使用google与"alternativeLanguageCodes“一起使用文本
API
时,接收使用过的语言
例如:alternativeLanguageCodes: ["fr","it"] Google语音自动地返回给我一个转录,其中的信心足够高,它可能实际上是正确的,
音频
文件的说话人发言是否有任何方法使
api
返回这种元数据(比如lang:'fr')?
浏览 0
提问于2020-10-29
得票数 0
回答已采纳
1
回答
如何在python中接收
音频
输入并将其转换为文本字符串
、
、
、
我想我的问题从标题上说得很清楚例如,如果我使用麦克风并说“你好”,python程序将返回" Hellow“作为文本值。
浏览 4
提问于2017-05-26
得票数 0
回答已采纳
1
回答
有人知道Android 4.1+离线语音
识别
API
文档吗?
、
我正在尝试在Android 4.1.2和4.3上构建一个离线语音
识别
Android应用程序,并且我正在尝试访问Android ASR
API
。我可以在上找到所有与同步语音
识别
相关的信息(使用意图),但是没有关于异步
识别
的信息(我想
识别
文件中的
音频
内容)。非常感谢!如果我把我想要做的事情换成另一种方式:我有一个录制了演讲的
音频
文件,我想以离线模式(例如,没有互联网连接)将该文件的内容发送到Android<e
浏览 0
提问于2013-09-16
得票数 1
1
回答
如何使用python找出两个语音文件的差异
、
、
、
、
我想要两个比较两个语音文件,并找出他们之间的差异。假设我有一个音乐轨道原始文件和另一个我从音乐中读出的文件,我想让两个文件比较这两个文件并找出它们的音素之间的差异。实际上,单词对我来说并不重要,重要的是音素之间的相似度,我想找出类似于相似度百分比的值。我更喜欢用Python实现一些东西。
浏览 5
提问于2013-07-07
得票数 7
1
回答
如何在microsoft中从单个
音频
文件中
识别
多个扬声器-认知
、
我正在使用speaker Recognition
API
,我已经成功注册并
识别
了说话人。现在,我有多个用户在一段
音频
中发言,如何从
音频
中
识别
多个用户?
浏览 9
提问于2020-03-22
得票数 0
1
回答
如何进行
音频
扩展/规范化(强调高与低的区别)
、
我试图找出办法来强调
音频
中
高低
点的区别。我似乎找不到关于如何做到这一点的文档--也许这可以用ffmpeg来完成。会非常感谢那些对信号处理有更多了解的人的一些建议。
浏览 0
提问于2018-11-12
得票数 1
回答已采纳
1
回答
提高Google语音
API
的准确性
、
、
、
我目前正在我的Mac计算机上的一个网页上录制
音频
,并通过云语音
api
运行它来生成一个记录。然而,结果并不准确,结果中也有大量的缺词。 使用quickTime播放器记录作为.m4a文件保存的
音频
。使用命令行工具ffmpeg将.m4a文件转换为.flac,并将2个
音频
通道(立体声)合并为1个
音频
通道(m
浏览 1
提问于2018-08-16
得票数 3
回答已采纳
1
回答
Microsoft语音
识别
:通配符空白内容
、
在一个特殊的步骤,我想运行一个语法,只有捕捉
音频
的下一个给定的句子,根据引擎的属性。 但是为了开始/停止匹配,我假设引擎需要“单词”。所以我不知道怎么做?(下面的解释:我的应用程序使用google将所有垃圾
音频
转换为文本,因为听写太糟糕了,Kinect上也没有)
浏览 1
提问于2014-01-23
得票数 2
回答已采纳
1
回答
我们可以使用Google中的Web语音
API
来
识别
来自用户麦克风以外的其他来源的语音吗?
、
、
、
、
我想使用Google中的网络语音
API
来
识别
来自网页上的HTML5 <video>的语音。是否有一种方法可以将Web语音
API
与来自用户麦克风以外的其他地方的
音频
输入一起使用?在MDN ()上,它说: 语音
识别
是通过SpeechRecognition接口访问的,它提供了从
音频
输入中
识别
语音上下文的能力(通常通过设备的默认语音
识别
服务)。但是它没有明确指定这个
音频
输入是否可以来自用户的麦克风以外的其他地方,或者它是否必须完
浏览 6
提问于2017-09-06
得票数 3
回答已采纳
1
回答
android语音输入
识别
器中的
音频
预处理
、
、
我正在做一些基本的命令
识别
,并使用Google Search Input
API
。然而,我想自己捕获
音频
,预处理
音频
(去噪,提高振幅等),发送这些修改后的
音频
到
识别
器并获得结果。有可能吗?我知道你可以通过onBufferReceived方法同时使用SpeechRecognizer和RecognitionListener来获取
音频
。然而,我想做的是预处理而不是后处理。有没有什么变通方法/破解方法来将处理后的数据提供给google
识别
器?
浏览 0
提问于2012-05-13
得票数 0
回答已采纳
点击加载更多
相关
资讯
名片扫描识别API
opencv笔记—人脸识别API
增值税发票识别api开发接口
科拓高低位视频桩,自动识别,24小时管理
户口本识别_户口簿文字识别_证件识别api接口_快瞳科技
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券