腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何从数据库中存储
语音
并进行识别?
、
、
、
在web应用程序中将有2个页面,其中一个页面将记录
语音
并存储在数据库中,在第二个页面中,任何用户都可以在该web应用程序与该
语音
和数据库匹配后说任何话,它将返回用户名。
浏览 1
提问于2017-04-26
得票数 2
3
回答
使用MFCC进行
语音
识别
、
、
、
、
我目前正在使用傅里叶变换结合Keras进行
语音
识别(说话人识别)。我听说MFCC是
语音
识别的更好的选择,但我不确定如何使用它。 我在
python
(3)中使用librosa来提取20个MFCC
特征
。我要做的是获得必要的
特征
,并为神经网络做一个长向量输入。然而,也可以显示颜色,所以图像识别也是可能的,还是更多地针对
语音
,而不是说话人识别?
浏览 4
提问于2018-12-04
得票数 0
1
回答
声纹中有没有与文本无关的
特征
、
、
我刚接触
语音
和说话人识别问题,我理解了mfcc的工作方式,但就我所理解的(并发现)不同的单词之间的系数不同。我的问题是:有没有其他与文本无关的
特征
提取方法?如果是这样的话,请再向他们说明。
浏览 3
提问于2015-12-17
得票数 0
1
回答
如何建立
语音
情感数据集?
、
这是通过将他的
语音
波形作为一个字节序列(每个字节为0到255)输入网络来实现的。增加音量的变化颠倒序列似乎不适用,毕竟,我的网络将预测非反向的
语音
,当它经过充分的训练。
浏览 0
提问于2018-05-24
得票数 1
回答已采纳
2
回答
从音频波形数据中检测说话人的性别
、
、
我想在我正在开发的新闻视频翻译应用程序中添加性别检测功能,以便该应用程序可以根据屏幕上的
语音
在男性和女性
语音
之间切换。我不期望100%的准确率。谁能建议我如何提取MFCC
特征
,并使用Open Ears (用于iOS平台的CMU Sphinx )输入到通用模型/支持向量机分类器中?
浏览 0
提问于2015-05-22
得票数 4
1
回答
如何使用mfcc
特征
来训练用于
语音
识别的svm分类器?
、
、
我目前在
语音
识别的讨论阶段项目中,我使用MFCC
特征
提取,但从函数返回的MFCC
特征
是一个矩阵,例如,每个
语音
文件(Wav)的(20,38)
特征
矩阵。但是我如何将这个
特征
传递给SVM分类器呢?但每个样本的MFCC
特征
是一个矩阵。假设Xi是样本i的MFCC
特征
,那么传递给SVM的样本i的
特征
是: 1) 20*38个向量,例如matlab形式的Xi(:)。2)均值(Xi)。
浏览 1
提问于2013-03-01
得票数 4
回答已采纳
1
回答
在Text-to-Speech C#应用程序中操作“扬声器声码器”
、
、
我正在用C#开发一个文本到
语音
转换的应用程序。如何通过C#接口配置其音色?或者,我需要为该功能下载一个库吗?例如:Microsoft Sam的声音,现在我也想配置一个自定义的声音。 这是可能的吗?
浏览 1
提问于2012-07-03
得票数 0
1
回答
SpeechRecognition接口:如何获取
语音
特征
(MEL系数)
、
、
、
我打算为Android实现一个说话人验证应用程序,我想知道是否有办法从Android的
语音
识别模块中获取
语音
特征
(MEL系数)?请注意,说话人验证与
语音
识别略有不同,这就是我不直接使用
语音
识别的原因。
浏览 0
提问于2014-04-10
得票数 0
2
回答
语音
/音乐分类
、
、
我想确定音频文件的哪一部分包含
语音
或音乐。谢谢。
浏览 1
提问于2012-06-07
得票数 2
回答已采纳
1
回答
Windows Phone上的
语音
识别-
语音
转文本
、
、
嗨,有没有办法使用PromptBuilder来开发Windows Phone
语音
识别应用程序?我想做一个应用程序,可以识别我的声音,并用代码做一些事情,但我必须在Windows Phone上做这件事。
浏览 0
提问于2014-05-17
得票数 2
2
回答
获取音频文件,自动转录,获取输出,并将其与记录进行匹配。
我们有大约8000段视频的记录。然而,这些转录本没有任何计时文本(即:它们不是时间编码到视频中)。是否存在软件来做到这一点? 如果没有,您会使用什么软件方法来完成这一壮举?
浏览 0
提问于2013-02-03
得票数 2
1
回答
python
语音
输入傅里叶变换的
语音
识别
、
我知道google和amazon在他们的
语音
助手中都有
语音
/说话人识别的功能,但是如果傅里叶变换不能成功的话,还有什么好的方法来做到这一点呢?我的问题是: 如何在
python
中用音频输入来绘制傅里叶变换?如果这是可行的,我如何在神经网络中输入傅里叶变换(我想也许给每个神经元一个y值,神经元作为对应的x值)。
浏览 0
提问于2018-09-19
得票数 1
回答已采纳
1
回答
机器学习:针对不同数量
特征
的PCA
、
、
、
我是机器学习的新手,我正在构建一个简单的应用程序来识别
语音
数字。我的问题是,有哪些方法可以处理不同数量的特性。例如,我可以使用PCA始终提取一些固定数量的
特征
,然后在特定的学习算法中使用它们吗?这是我在分析其中一个
语音
数字时得到的。
浏览 0
提问于2016-11-03
得票数 0
1
回答
音频谱图中的
特征
提取
、
、
我有英文单词的音频和声谱图。(谱图是一个信号的频域表示)考虑词:链,变化,椅子,章。正如你所注意到的,“ch”音在考虑过的单词中很常见。 是否有一种算法可以让我识别光谱图(数据)的哪一部分在单词的谱图之间是共同的?换句话说,是否有一种算法可以识别每个单词中表示“ch”声音的声谱部分?
浏览 0
提问于2019-09-03
得票数 3
1
回答
上采样/内插视频
特征
的简单技术?
、
、
我正在尝试同时分析音频和视觉
特征
。我的音频
语音
特征
是使用隐马尔可夫模型工具包以100fps采样的mel频率倒谱系数。我的视觉
特征
来自我构建的嘴唇跟踪程序,采样速度为29.97fps。我知道我需要插入我的视觉
特征
,以便采样率也是100fps,但我找不到一个很好的解释或在线教程如何做到这一点。我发现的大多数帮助来自
语音
识别社区,他们代表读者假设有插值知识,即大多数人用一个简单的“插值视觉
特征
,以便采样率等于100fps”来覆盖这一步骤。万分感
浏览 0
提问于2011-09-22
得票数 0
1
回答
语音
生物识别技术在google辅助中的应用
、
、
、
对于其中一个项目,为了保护用户的PHI信息,我们希望在Google辅助应用程序中实现
语音
生物识别解决方案。需要您在以下方面提供指导: 如果有任何细节,请告诉我。谢谢。注:以上信息为谷歌主页或谷歌
浏览 0
提问于2018-07-27
得票数 1
1
回答
我找不到一种方法将我的wav文件用作PyTorch中的数据集
、
、
、
你好,我是PyTorch的新手,我想做一个简单的
语音
识别,但我不想使用pytorch.datasets,我有一些声音数据集,但我找不到任何地方可以帮助我。 我想使用.wav文件。
浏览 14
提问于2021-04-09
得票数 2
回答已采纳
2
回答
一个属性包含另一个属性。
、
我有一个电信数据集,它有很多属性,在这些属性中,有一个“
语音
邮件计划”属性接受“是”或“否”,另一个属性是“
语音
邮件呼叫”,它有许多值,但是当“
语音
邮件计划”为“no”时,总是为零。当从数据集中删除“
语音
邮件计划”时,分类器的准确性会降低,因此我们如何通知分类器,在零
语音
呼叫中,No受到阻碍
浏览 0
提问于2019-04-08
得票数 0
1
回答
如何改变扬声器的声音?
、
我试着用做一些类似的事情,但它不会改变声音…我怎样才能改变它呢?
浏览 1
提问于2012-12-09
得票数 1
1
回答
android中的文本到可视动画
我有一个android应用程序,我想在其中动画/可视化文本到
语音
。就像应用程序说出文本一样,该应用程序也会根据
语音
数据闪烁灯光。有人能指导我如何提取
语音
数据(提取哪些
特征
),然后如何将其映射到一些可视动画吗? 谢谢,艾哈迈德
浏览 1
提问于2012-09-07
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
语音芯片唤醒技术的特征有哪些
Python机器学习-特征工程
语音芯片识别系统的特征是什么
python面向对象三大特征
软件如何根据语音特征将文本转换成语音信号呢?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券