腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
语音
识别
中的新语言
、
、
我对
语音
识别
应用程序和
算法
很感兴趣,但实际上还没有将它们用于开发。我想我需要知道:现在有哪些
开源
软件?(Google的
语音
搜索程序是否使用任何
开源
的
语音
识别
软件?)现有的
语音
识别
软件,即使是付费的,是否提供了添加要
识别
的新语言的接口?如果你认为知道其他事情会更好,请让我知道!! 非常感谢大家。阿尔森
浏览 3
提问于2014-09-04
得票数 0
1
回答
具有精确时间戳的
语音
识别
?
、
、
有人知道一些精确的
语音
识别
API,或者有一些更好地准备音频文件的提示吗? 我想一个字一个字地确定,包括它们的确切时间戳。 非常感谢!
浏览 71
提问于2019-10-08
得票数 5
1
回答
有人能推荐一个用于音频模式
识别
的库吗?
、
、
我的问题描述: 我有一个样本音频文件,需要在另一个音频文件中找到它(例如,在音频文件中找到
识别
片段的开始和结束时间)。是否有用于执行此任务的库?
浏览 0
提问于2011-12-26
得票数 2
回答已采纳
1
回答
部分
语音
识别
、
我现在正在用微软的
语音
引擎进行
语音
识别
。在C#中设置和使用它非常简单,并且可以用比我最初想象的更少的代码行来实现更好的功能。
浏览 0
提问于2012-10-10
得票数 5
回答已采纳
2
回答
Windows Mobile -
语音
控制+
语音
合成(文本到
语音
)
、
、
、
我有Windows Mobile6.5应用程序,我需要添加简单的
语音
控制(如“是”和“否”命令
识别
)。我还想增加阅读LCD上显示的文本的可能性。
浏览 3
提问于2010-04-09
得票数 0
1
回答
谷歌
语音
识别
是如何工作的?
我知道音频指纹
识别
音频文件,这是很棒的,但我真正想知道的是Google是如何制作
语音
识别
API的,它们是如何获取音频和返回的单词的。用途:我想知道从音频记录到转换成文本的服务器流。
浏览 5
提问于2014-02-27
得票数 0
回答已采纳
3
回答
音频分析来检测人类的声音、性别、年龄和情绪--之前有没有做过
开源
工作?
、
、
、
在“音频分析”领域有没有以前做过的
开源
工作来检测人声(比如在一些背景噪音的情况下),确定说话者的性别,可能不会。演讲者的年龄、演讲者的情绪?我的直觉是,像CMU Sphinx这样的
语音
识别
软件可能是一个很好的起点,但如果有更好的东西,那就太好了。
浏览 1
提问于2011-02-21
得票数 24
回答已采纳
2
回答
C#中不使用windows
语音
识别
的
语音
识别
、
、
我知道第一个评论是我复制了之前的线程,但我找到的代码(来自MSDN)使用了window的
语音
识别
……我正在做我的毕业设计,
语音
识别
是其中的一部分!
浏览 1
提问于2011-09-07
得票数 2
回答已采纳
1
回答
语音
识别
、
、
、
、
我想在上面实现一个
语音
识别
功能。假设我有一些用户称之为“嘿”、“1”、“2”、"tea“的记录,当他/她说”嘿“时,
语音
识别
api应该
识别
这些记录的第一个输入。”我已经找到了一些apis,这些apis支持
语音
识别
或有听觉打印
算法
。但我不想用它们。 让我解释一下为什么我不使用这些apis。首先,
语音
识别
apis试图理解单词并转换为文本。即使
语音
识别
a
浏览 4
提问于2016-06-20
得票数 4
1
回答
单词错误率能帮助分析口吃吗?
、
、
、
、
我正在制作Android应用程序,需要输入音频。并检测到口吃。
浏览 9
提问于2020-05-22
得票数 0
5
回答
开源
音频模式
识别
(指纹
识别
)
、
、
有没有
开源
的音频指纹
识别
解决方案可以提供“类似Shazam”的解决方案? 使用的商业解决方案,但我正在寻找替代方案(即使在准确性和性能方面较差)的
开源
解决方案。有谁知道这样的实现,甚至知道已发布的未实现的
算法
吗?
浏览 0
提问于2011-06-08
得票数 28
回答已采纳
3
回答
限制Android上的
语音
识别
结果
、
、
我在让Android
语音
识别
器符合我的想法时遇到了一点小问题。 有没有一种方法可以只将“有效”的参数传递给SpeechRecognizer,并让它在这些“最佳”匹配中进行选择?
浏览 1
提问于2013-06-09
得票数 3
3
回答
如何从
语音
文件中
识别
短语
、
、
如何让引擎成功
识别
语音
文件(wav/mp3/etc)中的短语?我见过使用字典的
语音
到文本转换的示例,但我不确定它在这里如何有用。我想也许可以将所有的
语音
文件转换成文本,然后简单地在文本中查找特定的短语,但我认为这不是正确的方法。例如,将5小时的
语音
转换为文
浏览 2
提问于2012-04-30
得票数 4
回答已采纳
1
回答
如何在c#中将
语音
转换为文本?(不使用任何sdk或System.speech.*)
、
我正在做毕业设计,
语音
识别
也是其中的一部分。我已经搜索了很多关于它,并发现了不同的SDK是可用的,甚至
语音
识别
器引擎在c#。我不能包括这些代码,我得从头开始在我的密码上试一试。现在,我已经能够从麦克风中获取
语音
输入,并将其存储到一个wave文件中。我希望将相同的文件或字节流传递给
语音
识别
,以便将
语音
转换为文本。
浏览 3
提问于2012-03-04
得票数 0
回答已采纳
2
回答
linux下的简单
语音
识别
、
有人有在linux下运行
语音
识别
的简单教程吗?我看到pocketsphinx在软件中心可以作为二进制下载,但是从终端运行它会失败,报告它需要参数,但是我不知道该放什么。我正在寻找的东西,得到60%正确的
识别
麦克风输入有限的词汇量和单词,然后可以写到一个文本文件-这些东西存在于80年代末。所以,我知道它的存在,并应该以某种方式起作用。(网络连接是不可以的)
浏览 0
提问于2013-05-20
得票数 17
15
回答
您的交互式
语音
应答平台是什么?
、
、
、
对于那些在
语音
领域工作的人来说,你们使用什么作为IVR平台?我使用的是Microsoft Speech Server 2007。一些等价的包是什么?是否有人使用
开源
软件来处理入站或出站呼叫?请注意,我不仅仅是在谈论
语音
识别
,它是一个综合软件包的一个组件。
语音
识别
平台将包括
语音
识别
、文本到
语音
转换、诸如VoiceXML之类的VUI技术,以及通过SIP或电话硬件的呼叫终止。
浏览 29
提问于2008-08-14
得票数 4
1
回答
开放源码的自动
语音
匹配?
、
、
自动
语音
匹配不是自动
语音
识别
,而是比较两段
语音
信号,并返回这两种
语音
信号匹配的百分比。因此,我们需要找出一些
算法
来比较这两个一维音频信号。这里的问题是为ASM寻找一些好的
开源
或商业解决方案。
浏览 2
提问于2011-12-07
得票数 2
3
回答
iPhone
语音
识别
应用编程接口
、
新的iPhone 3GS支持
语音
命令,如“呼叫比尔”或“按笔划播放音乐”等。有没有人知道苹果是否在SDK中添加了
语音
命令API,或者它是不是另一个被禁止的API?如果它确实存在,可以有人给我指出一个特定的类吗?
浏览 1
提问于2009-07-13
得票数 7
回答已采纳
3
回答
添加录音
语音
识别
iPhone
、
、
、
在那之后,我需要
识别
它,例如:我启动了程序,说了些什么,当程序收到已经录制的单词时,它显示UIAlertView。有人知道任何sdk或示例代码吗?谢谢..
浏览 4
提问于2011-10-17
得票数 1
回答已采纳
3
回答
如何检测是谁在说话?
、
、
、
“在那之后,它只
识别
“John”的
语音
命令,而忽略不同的声音。
浏览 3
提问于2013-03-20
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
语音芯片语音识别有哪些算法
OpenAI 开源语音识别模型 Whisper
5 款不错的开源语音识别/语音文字转换系统
谷歌开源Live Transcribe语音识别转文字工具
Facebook开源语音识别系统和机器学习库
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券