开源语音识别算法 - 腾讯云开发者社区

、、

我对语音识别应用程序和算法很感兴趣，但实际上还没有将它们用于开发。我想我需要知道:现在有哪些开源软件？(Google的语音搜索程序是否使用任何开源的语音识别软件？)现有的语音识别软件，即使是付费的，是否提供了添加要识别的新语言的接口？如果你认为知道其他事情会更好，请让我知道！！非常感谢大家。阿尔森

浏览 3提问于2014-09-04得票数 0

1回答

具有精确时间戳的语音识别？

、、

有人知道一些精确的语音识别API，或者有一些更好地准备音频文件的提示吗？我想一个字一个字地确定，包括它们的确切时间戳。非常感谢!

浏览 71提问于2019-10-08得票数 5

1回答

有人能推荐一个用于音频模式识别的库吗？

、、

我的问题描述：我有一个样本音频文件，需要在另一个音频文件中找到它(例如，在音频文件中找到识别片段的开始和结束时间)。是否有用于执行此任务的库？

浏览 0提问于2011-12-26得票数 2

回答已采纳

1回答

部分语音识别

、

我现在正在用微软的语音引擎进行语音识别。在C#中设置和使用它非常简单，并且可以用比我最初想象的更少的代码行来实现更好的功能。

浏览 0提问于2012-10-10得票数 5

回答已采纳

2回答

Windows Mobile -语音控制+语音合成(文本到语音)

、、、

我有Windows Mobile6.5应用程序，我需要添加简单的语音控制(如“是”和“否”命令识别)。我还想增加阅读LCD上显示的文本的可能性。

浏览 3提问于2010-04-09得票数 0

1回答

谷歌语音识别是如何工作的？

我知道音频指纹识别音频文件，这是很棒的，但我真正想知道的是Google是如何制作语音识别API的，它们是如何获取音频和返回的单词的。用途：我想知道从音频记录到转换成文本的服务器流。

浏览 5提问于2014-02-27得票数 0

回答已采纳

3回答

音频分析来检测人类的声音、性别、年龄和情绪--之前有没有做过开源工作？

、、、

在“音频分析”领域有没有以前做过的开源工作来检测人声(比如在一些背景噪音的情况下)，确定说话者的性别，可能不会。演讲者的年龄、演讲者的情绪？我的直觉是，像CMU Sphinx这样的语音识别软件可能是一个很好的起点，但如果有更好的东西，那就太好了。

浏览 1提问于2011-02-21得票数 24

回答已采纳

2回答

C#中不使用windows语音识别的语音识别

、、

我知道第一个评论是我复制了之前的线程，但我找到的代码(来自MSDN)使用了window的语音识别……我正在做我的毕业设计，语音识别是其中的一部分！

浏览 1提问于2011-09-07得票数 2

回答已采纳

1回答

语音识别

、、、、

我想在上面实现一个语音识别功能。假设我有一些用户称之为“嘿”、“1”、“2”、"tea“的记录，当他/她说”嘿“时，语音识别api应该识别这些记录的第一个输入。”我已经找到了一些apis，这些apis支持语音识别或有听觉打印算法。但我不想用它们。让我解释一下为什么我不使用这些apis。首先，语音识别apis试图理解单词并转换为文本。即使语音识别a

浏览 4提问于2016-06-20得票数 4

1回答

单词错误率能帮助分析口吃吗？

、、、、

我正在制作Android应用程序，需要输入音频。并检测到口吃。

浏览 9提问于2020-05-22得票数 0

5回答

开源音频模式识别(指纹识别)

、、

有没有开源的音频指纹识别解决方案可以提供“类似Shazam”的解决方案？使用的商业解决方案，但我正在寻找替代方案(即使在准确性和性能方面较差)的开源解决方案。有谁知道这样的实现，甚至知道已发布的未实现的算法吗？

浏览 0提问于2011-06-08得票数 28

回答已采纳

3回答

限制Android上的语音识别结果

、、

我在让Android语音识别器符合我的想法时遇到了一点小问题。有没有一种方法可以只将“有效”的参数传递给SpeechRecognizer，并让它在这些“最佳”匹配中进行选择？

浏览 1提问于2013-06-09得票数 3

3回答

如何从语音文件中识别短语

、、

如何让引擎成功识别语音文件(wav/mp3/etc)中的短语？我见过使用字典的语音到文本转换的示例，但我不确定它在这里如何有用。我想也许可以将所有的语音文件转换成文本，然后简单地在文本中查找特定的短语，但我认为这不是正确的方法。例如，将5小时的语音转换为文

浏览 2提问于2012-04-30得票数 4

回答已采纳

1回答

如何在c#中将语音转换为文本？(不使用任何sdk或System.speech.*)

、

我正在做毕业设计，语音识别也是其中的一部分。我已经搜索了很多关于它，并发现了不同的SDK是可用的，甚至语音识别器引擎在c#。我不能包括这些代码，我得从头开始在我的密码上试一试。现在，我已经能够从麦克风中获取语音输入，并将其存储到一个wave文件中。我希望将相同的文件或字节流传递给语音识别，以便将语音转换为文本。

浏览 3提问于2012-03-04得票数 0

回答已采纳

2回答

linux下的简单语音识别

、

有人有在linux下运行语音识别的简单教程吗？我看到pocketsphinx在软件中心可以作为二进制下载，但是从终端运行它会失败，报告它需要参数，但是我不知道该放什么。我正在寻找的东西，得到60%正确的识别麦克风输入有限的词汇量和单词，然后可以写到一个文本文件-这些东西存在于80年代末。所以，我知道它的存在，并应该以某种方式起作用。(网络连接是不可以的)

浏览 0提问于2013-05-20得票数 17

15回答

您的交互式语音应答平台是什么？

、、、

对于那些在语音领域工作的人来说，你们使用什么作为IVR平台？我使用的是Microsoft Speech Server 2007。一些等价的包是什么？是否有人使用开源软件来处理入站或出站呼叫？请注意，我不仅仅是在谈论语音识别，它是一个综合软件包的一个组件。语音识别平台将包括语音识别、文本到语音转换、诸如VoiceXML之类的VUI技术，以及通过SIP或电话硬件的呼叫终止。

浏览 29提问于2008-08-14得票数 4

1回答