腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
iPhone
语音
识别应用编程接口
、
新的iPhone 3GS支持
语音
命令,
如
“呼叫比尔”或“按笔划播放音乐”等。有没有人知道苹果是否在SDK中添加了
语音
命令API,或者它是不是另一个被禁止的API?如果它确实存在,可以有人给我指出一个特定的类吗?
浏览 1
提问于2009-07-13
得票数 7
回答已采纳
1
回答
是否有一种
说话
人对文本对话的误码率算法?
、
一些
语音
对文本的服务,
如
Google
语音
到文本,通过对话提供
说话
人的区分,它试图识别和分离单个音频记录上的多个扬声器。这是经常需要的,当多个发言者在会议室共用一个麦克风。是否有算法和实现来计算
说话
人分离的正确性? 这将与一起使用,后者通常用于检验基线转录的正确性。
浏览 2
提问于2019-08-27
得票数 0
回答已采纳
2
回答
语音
开始
时
自动录音,
语音
停止
时
自动播放
、
有没有人可以帮我做以下事情: 自动录制
语音
,并在静默
时
播放一段时间,就像在
说话
一样。谁能帮我找出
说话
汤姆背后的逻辑。当用户开始
说话
时
,它应该自动录音,当用户停止
说话
时
,应该回放录制的
语音
。
浏览 0
提问于2012-07-06
得票数 1
2
回答
基于
语音
(噪声)强度级别的
语音
识别?
、
我能够做到这一点,使用按钮,将启动
语音
识别器为我。但现在我只想让它基于我的声音工作。if(no silense)else if(silence)Show toast 主要的问题是,在启
浏览 6
提问于2012-06-13
得票数 1
回答已采纳
1
回答
语音
数据集中的基音检测
、
我正在做
说话
人识别项目。为了识别不同的
语音
片段是否相同,我提取了多个特征,
如
MFCC、节奏、色度、拍次、和声、敲击、旋律谱等等。现在我还想找到
语音
剪辑的音高,以找到我正在使用的代码:y,sr = librosa.load('E:/Audio_clip/cant.wav')#print(S)但是,当我将
浏览 5
提问于2018-01-10
得票数 1
1
回答
discord.js user.speaking不工作
、
//function fires after special command every 100 milliseconds bot.channels.forEach((channel, chanId) => { if (channel.type == 'voice'
浏览 4
提问于2017-11-10
得票数 0
1
回答
从应用程序启动Jelly Bean
语音
搜索?
我如
何在
jellybean上直接启动默认的google
语音
搜索,之后您可以直接
说话
,而不需要按任何按钮?
浏览 0
提问于2013-02-23
得票数 0
回答已采纳
3
回答
Google Cloud Speech API实时识别
、
我需要实时识别
语音
:当用户说什么
时
,它会自动将这段音频发送到Google speech API并返回文本。因此,我希望在
说话
时
立即显示识别出的文本。我已经找到了流式
语音
识别,但似乎我仍然需要先录制完整的
语音
,然后再将其发送到服务器。此外,也没有如
何在
Python中使用它的示例 有没有可能用Google Speech API做到这一点?
浏览 7
提问于2017-05-19
得票数 0
1
回答
将扬声器注释(例如id,name)添加到云
语音
到文本api中,并将其包含在云
语音
到文本api生成的输出json中。
Google云平台的云
语音
到文本api将多个扬声器音频转换为文本。它返回一个JSON输出,其中包括谁在什么时候说了什么。但
说话
人识别(WHO)是匿名的。
浏览 1
提问于2021-01-12
得票数 0
1
回答
AVSpeechSynthesizer需要在重新启动之前完成
、
、
、
如果我有一个按钮,让AVSpeechSynthesizer说,“你好,世界”,每次我按它,声音不会再开始
说话
,直到它完成第一个文本到
语音
字符串。 @IBAction func helloButton(sender: AnyObje
浏览 1
提问于2016-09-06
得票数 2
0
回答
AI
语音
转文字让图片里面的嘴
说话
吗?
、
1、用户侧需录入
语音
转文本并作为消息发送到 ai侧。4、默认情况下(在用户没有和ai沟通
时
),用
浏览 49
提问于2024-03-26
1
回答
在android中,可以在edittext旁边添加
语音
操作按钮吗
我们可以在edittext旁边有一个谷歌
语音
操作按钮吗,所以每当用户想要在编辑文本中输入一些东西
时
,他只需轻敲按钮,
说话
,然后进入edittext。我们可以这样做吗,而不是用户必须轻敲edittext打开软键盘选择
语音
操作按钮,然后
说话
,然后打印到edittext上。谢谢。
浏览 4
提问于2012-08-17
得票数 7
回答已采纳
1
回答
当一个人在声音频道讲话
时
,我能让不和谐的巨蟒识别出来吗?
、
、
我目前正在创建一个不和谐的Python机器人,我希望这个机器人能够识别
语音
频道中的人们
说话
的时候。机器人不一定能识别
语音
。 例如,如果一个成员发言,我希望机器人做一个动作,
如
播放音频。此外,如果有人知道任何有关识别
语音
或监控某人声音的声音,请让我知道!
浏览 2
提问于2021-04-25
得票数 9
1
回答
VAD和
说话
人分割有什么区别?
、
、
、
我不确定我能区分和理解以下几个方面的区别:Speaker SegmentationVAD -分割
语音
段或非
语音
段的音频 扬声器分割-将音频分割成非
语音
片段和不同的扬声器
浏览 0
提问于2023-04-03
得票数 0
1
回答
SAPI -如何停止所有异步
语音
任务?
、
、
、
、
我正在使用Microsoft的
语音
应用程序编程接口(SAPI)在我的应用程序中启用
语音
。然而,当我尝试停止异步
语音
任务
时
,它们会停止,但在一秒钟之后。在.NET框架中,我尝试停止所有异步
语音
任务,它们在我调用SpeechSynthesizer.SpeakAsyncCancelAll
时
立即停止。然而,当我试图取消 (C++)中的
语音
时
,
语音
会在一秒钟(或更多)之后停止。我用调用SVSFlagsAsync,当然也调用枚举中的SVSFPur
浏览 10
提问于2022-11-22
得票数 0
回答已采纳
1
回答
HTML5初学者。我想要一个运行Java程序的Speech-Box
、
、
、
、
我是HTML的初学者,我在看,想知道如
何在
文本输入或
说话
时
按enter键,然后用文本框中的输入字符串运行HelloWorld应用程序。 我想要一个我需要做的简单概要。如果有任何关于文本到
语音
输出的建议,那将是锦上添花:)
浏览 2
提问于2012-02-07
得票数 0
回答已采纳
1
回答
Javascript中具有默认超时的Web speech api
、
、
、
我正在使用下面的演示来识别
语音
。它是有效的,但有时需要更多的时间来加载或识别
语音
文本。不知道为什么会这样!
浏览 0
提问于2016-02-06
得票数 0
1
回答
文本标注在NLP上下文中的含义
、
在自然语言处理中,标注语料库是什么意思?
浏览 1
提问于2020-07-08
得票数 0
2
回答
使用机器学习创建
语音
识别系统
、
作为机器学习的一个教育项目,我正在考虑从头开始创建一个
语音
识别系统。它应该能够从之前经过
语音
训练的
说话
人的声音中识别出他/她。如有任何建议,我们将不胜感激:)
浏览 1
提问于2013-02-28
得票数 0
回答已采纳
3
回答
个人
语音
识别/识别
、
我想要录制某人的声音,然后从我获得的关于他/她的声音的信息中,我可以识别出这个人是否还在
说话
!问题是,我没有关于什么统计数据(
如
频率)导致人类声音差异的信息,如果有人可以帮助我如何识别某人的声音?当我在研究的时候,我发现了各种关于
语音
识别的库,但它们对我没有帮助,因为我的问题非常简单!我只想认出那个
说话
的人,而不是他在说什么。
浏览 1
提问于2012-03-05
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
微信语音说话时,声音很难听怎么办?
“如时”APP上线,可时间轴型发布图文、短视频、语音
玩游戏上分重要还是开心重要?如每人都为了分数名次而战,那游戏意义何在?
玩游戏点错有哪些尴尬事?上厕所时打开了《一梦江湖》世界语音
人声分离攻破“鸡尾酒会”效应,将为语音识别带来哪些新可能?
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券