音频高低识别api - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

如何在不获取麦克风权限的情况下重启webkitSpeechRecognition？

如果我停止识别并重新启动，它会再次要求麦克风许可。它是否有任何想法暂停识别，并在发言结束后继续？

浏览 7提问于2019-04-20得票数 0

1回答

Google语音API现场识别

、、、

我想知道是否有可能用这个rest进行某种livespeech识别。我可以提出一个单一的要求，但我想要流我的音频数据和处理结果随着时间的推移。

浏览 1提问于2018-09-12得票数 0

回答已采纳

2回答

如何下载WordPress音频附件

、、

我一直在搜索高低，试图找出如何创建下载链接的音频文件上传到一个帖子。我知道如何将音频url直接显示到主题模板中，但是当它被点击时，它就会开始在浏览器中显示音频。

浏览 0提问于2013-03-02得票数 0

1回答

能否向Azure说话人识别API发送实时数据？

、、、、

我使用Microsoft说话人识别API来区分人们的声音。或者，除了这个API，还有其他的方法吗？

浏览 4提问于2018-01-14得票数 1

3回答

我正在编写一个应用程序，它应该接收音频，并将它发送到Bing识别API以获取文本。我使用了服务库，它与wav文件一起工作。因此，我编写了自己的流类，以接收来自麦克风或网络(RTP)的音频，并将其发送到识别API。当我在音频流前面添加一个WAV头时，它会工作几秒钟。调试表明，识别api读取表单流的速度比由音频源填充的速度快(16k采样，16位，mono)。因此，我的问题是:是否有一种方法来使用实时(连续)音频

浏览 1提问于2016-12-12得票数 4

回答已采纳

1回答

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

、、、、

这里我的谷歌语音设置给AI发短信以下是语音到文本AI：的输出文件这是视频链接：这是提供给Google：的视频的音频文件。这是我用来提取视频音频的命令：ffmpeg -i "input.mkv" -af aformat=s16:48000:output.flac

浏览 5提问于2020-10-12得票数 4

1回答

在mp3格式)从语音识别？

、、、、

可能重复：我在android上使用语音识别类，我成功地获得了语音识别。但我想要的是真实的语音数据，而不是文字，而不是文字。

浏览 1提问于2012-11-04得票数 3

1回答

SpeechRecognitionEngine.setInputToDefaultAudioDevice() Microsoft.Speech方法投掷System.InvalidOperationException

、

我正在尝试将音频流的输入设置为麦克风，这是默认的音频设备，但它正在抛出异常：感谢你的帮助！

浏览 1提问于2015-10-24得票数 3

1回答

沃森在python中用"interim_results = True“对文本的讲话给出了ValueError

、

当使用Python使用沃森语音到文本服务时，设置interim_results = True时每次都会出现以下错误： raise ValueError(errmsg("Extra data", s, end, len(s)))我使用一个大约6秒长的.wav文件运行它(

浏览 4提问于2017-07-31得票数 0

回答已采纳

1回答

Google语音API流

我试图用合并方法将我的PBX连接到Google，但是由于我需要记录语音，将它发送到API，等待响应并将其处理回来，所以不可能进行正常的会话或尝试使用正常的会话/处理语音来进行实时服务。推荐其他API吗？或者是否有一种方式来设置VoIP/流到谷歌。类似于Alexa/Google。我没有找到对象的任何内容：

浏览 3提问于2017-01-19得票数 2

回答已采纳

1回答

当使用google与"alternativeLanguageCodes“一起使用文本API时，接收使用过的语言

例如：alternativeLanguageCodes: ["fr","it"] Google语音自动地返回给我一个转录，其中的信心足够高，它可能实际上是正确的，音频文件的说话人发言是否有任何方法使api返回这种元数据(比如lang：'fr')？

浏览 0提问于2020-10-29得票数 0

回答已采纳

1回答

如何在python中接收音频输入并将其转换为文本字符串

、、、

我想我的问题从标题上说得很清楚例如，如果我使用麦克风并说“你好”，python程序将返回" Hellow“作为文本值。

浏览 4提问于2017-05-26得票数 0

回答已采纳

1回答

有人知道Android 4.1+离线语音识别API文档吗？

、

我正在尝试在Android 4.1.2和4.3上构建一个离线语音识别Android应用程序，并且我正在尝试访问Android ASR API。我可以在上找到所有与同步语音识别相关的信息(使用意图)，但是没有关于异步识别的信息(我想识别文件中的音频内容)。非常感谢！如果我把我想要做的事情换成另一种方式:我有一个录制了演讲的音频文件，我想以离线模式(例如，没有互联网连接)将该文件的内容发送到Android<e

浏览 0提问于2013-09-16得票数 1

1回答

如何使用python找出两个语音文件的差异

、、、、

我想要两个比较两个语音文件，并找出他们之间的差异。假设我有一个音乐轨道原始文件和另一个我从音乐中读出的文件，我想让两个文件比较这两个文件并找出它们的音素之间的差异。实际上，单词对我来说并不重要，重要的是音素之间的相似度，我想找出类似于相似度百分比的值。我更喜欢用Python实现一些东西。

浏览 5提问于2013-07-07得票数 7

1回答

、、

我正在做一些基本的命令识别，并使用Google Search Input API。然而，我想自己捕获音频，预处理音频(去噪，提高振幅等)，发送这些修改后的音频到识别器并获得结果。有可能吗？我知道你可以通过onBufferReceived方法同时使用SpeechRecognizer和RecognitionListener来获取音频。然而，我想做的是预处理而不是后处理。有没有什么变通方法/破解方法来将处理后的数据提供给google识别器？

浏览 0提问于2012-05-13得票数 0

回答已采纳

点击加载更多

如何在不获取麦克风权限的情况下重启webkitSpeechRecognition？

Google语音API现场识别

如何下载WordPress音频附件

能否向Azure说话人识别API发送实时数据？

是否有可能将实时数据发送到Bing语音识别？

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

在mp3格式)从语音识别？

SpeechRecognitionEngine.setInputToDefaultAudioDevice() Microsoft.Speech方法投掷System.InvalidOperationException

沃森在python中用"interim_results = True“对文本的讲话给出了ValueError

Google语音API流

当使用google与"alternativeLanguageCodes“一起使用文本API时，接收使用过的语言

如何在python中接收音频输入并将其转换为文本字符串

有人知道Android 4.1+离线语音识别API文档吗？

如何使用python找出两个语音文件的差异

如何在microsoft中从单个音频文件中识别多个扬声器-认知

如何进行音频扩展/规范化(强调高与低的区别)

提高Google语音API的准确性

Microsoft语音识别:通配符空白内容

我们可以使用Google中的Web语音API来识别来自用户麦克风以外的其他来源的语音吗？

android语音输入识别器中的音频预处理

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐