腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
4
回答
基于iPhone的语音识别
、
我需要开发一个识别语音的iPhone应用程序,并根据结果执行进一步的任务。 我知道iPhone 3.0不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,我不知道如何处理它。 是指我需要购买哪些软件并在服务器端实现它,以及如何使用该服务??
浏览 2
提问于2009-07-13
得票数 6
3
回答
OSX的语音识别库?
、
、
、
所以我一直在网络上寻找Python语音识别,我找到了pyspeech。但这只适用于Windows。我想要一个语音识别库,与Mac aswel一起工作。谢谢!
浏览 2
提问于2012-06-21
得票数 3
回答已采纳
1
回答
谷歌语音识别是如何工作的?
我知道音频指纹识别音频文件,这是很棒的,但我真正想知道的是Google是如何制作语音识别API的,它们是如何获取音频和返回的单词的。 我写了一个宝石来指纹wav音频文件并对它们进行比较,但是如果我用指纹将我的声音与充满指纹的数据库进行比较,可能要花费很长时间。谷歌是怎么做到的? 用途: 我真的很喜欢语音识别,我想要一个地方开始编码,但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子,所有这些软件都非常快。 我想知道从音频记录到转换成文本的服务器流。
浏览 5
提问于2014-02-27
得票数 0
回答已采纳
1
回答
Ubuntu中有用于电话的语音识别吗?
、
Ubuntu能够识别语音命令吗? 什么类型的语音识别是内置的,它在Ubuntu桌面上是可用的吗?
浏览 0
提问于2013-03-02
得票数 3
1
回答
用于记录已完成会议的语音识别软件
、
我正在寻找语音识别软件,我可以有分析某些音频(S)文件(与用户(S)的声音在其中),标记的声音为用户(本人) x。 这样做的目的是,在开会时,软件识别数据库中的声音,将这些声音标记为用户X、Y和Z,他们所说的一切都将被标记为 "X:我认为我们需要有一种数字化的方式来记录我们的讨论/会议“ "Y:那似乎是个好主意。“ "Z:识别我们的声音并将单词标记为X/Y/Z的人“。
浏览 0
提问于2016-09-13
得票数 1
2
回答
Windows语音识别软件,以音频文件为输入,输出文本文件
、
、
我对用于Windows的语音识别软件感兴趣,它以一种标准格式(MP3、WAV、OGG等)获取播客的音频文件,并将语音的转录作为文本文件输出。其动机是帮助为官方wiki录制播客。 我希望它能够教它,提高语音识别,或学习新单词。此外,它应该能够处理多人交谈,偶尔重叠的讲话,偶尔的音乐,或非说话的声音。 我只需要这个软件来处理英语。
浏览 0
提问于2014-04-14
得票数 5
1
回答
Microsoft语音识别默认值与API
、
、
、
因此,我一直在Windows10中使用微软语音识别,做训练练习,将文本口述到写字板中并进行更正,向字典中添加单词等等。我想用这个软件来转录.wav文件。似乎可以使用Windows语音识别API来做到这一点,但这似乎涉及到创建和加载自己的语法文件,这向我表明,这基本上将创建一个新的语音识别器,它使用相同的构建块,但与我在开始菜单中单击“开始语音识别”时运行的程序不同。特别是,由于训练或配置的不同,它的性能会有所不同。 这一点我说错了吗?如果不是,是否还有一种方法可以检索默认语音识别器使用的所有数据,以便我可以准确地再现它的行为?如果我需要创建一个单独的语音识别器,它有自己的语法文件和单独的训练历
浏览 5
提问于2016-03-18
得票数 1
3
回答
如何在iphone中通过编码识别人声?
、
、
、
我想在我的iPhone应用程序中集成语音检测功能。iPhone应用程序允许用户使用自己的语音搜索单词。但是,我对iPhone中的语音识别一无所知。你能为我提供任何想法,教程或示例代码吗?
浏览 2
提问于2012-02-11
得票数 0
回答已采纳
1
回答
有没有一种使用语音识别来启动软件的方法?
我需要一个方法来启动一个软件,或使其窗口可见,如果它已经启动,使用一些语音识别设施。我希望取得以下成果: 我说" netbeans“>netbeans被推出 我说的“铬”>铬被启动,并被放在窗口堆栈的顶部。 我说的是" netbeans“>netbeans(已经打开)被带到窗口堆栈的顶部(在我们的例子中只有两个: chrome和netbeans)。 是可行的吗? 谢谢
浏览 0
提问于2018-04-08
得票数 3
2
回答
有没有语音认证库?
、
有没有人知道有没有好的语音认证库?或者我需要找到一个好的语音识别库并在此基础上构建?
浏览 1
提问于2011-09-01
得票数 15
回答已采纳
1
回答
说话人识别在iPhone应用中的应用
、
、
、
、
出于安全考虑,我想使用iPhone应用程序中的语音识别功能来跟踪语音。 每个用户都可以记录他/她的语音,并通过识别他/她的语音打开应用程序,该语音被记录并存储在数据库中。 有没有人对此功能有想法或示例应用程序,以及如何在iPhone应用程序中实现它?
浏览 0
提问于2012-08-28
得票数 2
2
回答
TTS和ASR是否有行业接口标准?
、
我被要求在我们的产品中开发一个文本到语音的模块,它应该支持各种文本到语音的引擎。 是否有标准描述如何与第三方TTS(文本到语音)服务或ASR(自动语音识别)服务接口?
浏览 9
提问于2012-06-27
得票数 2
回答已采纳
1
回答
在windows 10中使用python 2.7进行语音识别
、
、
、
、
我在我的64位Windows10系统中使用python2.7。我在SimpleCV框架上工作,我想实现语音识别来控制我的vlc媒体播放器。在SimpleCv或python2.7中有没有什么模块可以让我很容易地实现语音recognition.If,所以,请指导我完成整个过程。提前感谢!!
浏览 9
提问于2015-09-01
得票数 0
1
回答
如何在c#中将语音转换为文本?(不使用任何sdk或System.speech.*)
、
我知道这不是关于这个话题的第一条帖子,但是我已经搜索了所有关于这个话题的帖子,没有找到我想要的东西。我正在做毕业设计,语音识别也是其中的一部分。我已经搜索了很多关于它,并发现了不同的SDK是可用的,甚至语音识别器引擎在c#。我不能包括这些代码,我得从头开始在我的密码上试一试。 现在,我已经能够从麦克风中获取语音输入,并将其存储到一个wave文件中。我希望将相同的文件或字节流传递给语音识别,以便将语音转换为文本。 如果有人已经这样做了,并且能给我一个论文的链接或者一个代码,我会真的很感激。 ,提前谢谢!
浏览 3
提问于2012-03-04
得票数 0
回答已采纳
2
回答
是否有任何方法来改变来电者的声音,使声音识别不可能?
、
、
我搜索并找到了这篇文章: 是否可以用语音识别来识别手机用户? 然而,它并没有回答我的问题。 是否有任何方法改变一个人的声音,足以使手机呼叫无法识别的语音识别技术?
浏览 0
提问于2019-08-29
得票数 2
1
回答
VBS或WSH的声音触发事件
、
、
、
我需要建立一个脚本(VBS或WSH),它只是运行一些命令时,一个特定的声音是“听”。因此,它会将音频流(比如"blink.wav“文件)与来自操作系统(win xp)的任何传入音轨进行比较。请注意,这不是任何语音识别脚本,而是一个音频驱动的软件。 下面是我基本上想要实现的(更发达的)商业产品。 有没有可用的代码示例?SAPI接口对我的目的有用吗?真的非常感谢你!
浏览 3
提问于2014-09-23
得票数 1
15
回答
您的交互式语音应答平台是什么?
、
、
、
对于那些在语音领域工作的人来说,你们使用什么作为IVR平台?我使用的是Microsoft Speech Server 2007。一些等价的包是什么?是否有人使用开源软件来处理入站或出站呼叫?请注意,我不仅仅是在谈论语音识别,它是一个综合软件包的一个组件。语音识别平台将包括语音识别、文本到语音转换、诸如VoiceXML之类的VUI技术,以及通过SIP或电话硬件的呼叫终止。
浏览 29
提问于2008-08-14
得票数 4
2
回答
一种有效的录音质量检测方法
、
、
我们有来自我们的服务器端进程之一的实时、不加控制的记录的各种波形文件,而且它们中的大多数在整个过程中都有很好的清晰的语音。然而,有时他们是混乱的,他们有静态,或说话音量不够大。是否有一个有效的方法来确定一个记录是否被认为是“良好”质量使用C#? 我曾想过要把已知的好唱片的平面图和不好的录音进行比较,但是每次录音都会有不同的语言,所以这可能行不通。我研究过像Bass.Net和NAudio这样的库,但是音频处理不是我的专业领域。 我可以尝试比较,但我不完全确定它是如何工作的。我看到有人试图用他们的音频指纹哈希和Levenshtein距离算法来比较两个音频文件,以找到两个音频文件之间的相似度。除非音
浏览 6
提问于2013-08-14
得票数 0
回答已采纳
1
回答
语音识别和语调检测
、
、
我想做一个iOS应用程序来计算疑问句。我将寻找WH问题,也会问“我会吗?”设置问题格式。 我不太了解语音或音频技术领域,但我在Google上发现语音识别SDK很少。但我仍然不知道如何检测和绘制语调。有没有支持语调或情感语音识别的SDK?
浏览 3
提问于2013-03-20
得票数 2
1
回答
在iOS中将语音转换为文本
、
我正在寻找一个示例示例,它实现了open或任何其他语音识别器来将语音转换为文本。有什么教程可以帮我把课文转换成语音吗?
浏览 2
提问于2013-05-03
得票数 0
2
回答
CMU Sphinx能否设置为识别约200个单词
、
、
我有一个客户谁需要一个Android应用程序,可以识别口头命令。据我所知,内置的语音转文本功能实际上是将数据发送到谷歌的服务器,然后再将文本翻译传回。这是一个主要问题,因为语音数据非常敏感(除非数据在发送到Google和从Google发送时是加密的-但我怀疑它是加密的)。 我能想到的有两个选择。首先是在Android上将语音转换为文本,尽管这似乎是一项极其昂贵的操作。第二种可能是让本地服务器为我转换数据(我可以在发送和接收语音数据和翻译时对其进行加密)。这是CMU Sphinx可以做到的吗?值得注意的是,我还可以访问Asterisk服务器,这可能会对此有所帮助(我不知道)。 实际上,应该只有大
浏览 1
提问于2012-01-31
得票数 7
回答已采纳
1
回答
iPhone中的语音识别
、
语音识别是iPhone音频的一部分吗?我想为iPhone构建一个关于语音识别的示例代码。如何开始?请给我一些想法。在iPhone应用程序开发人员中有关于语音识别编程的文档吗? 谢谢,
浏览 3
提问于2010-07-01
得票数 0
回答已采纳
1
回答
Google语音识别时间戳
、
我有一个音频文件,而且我有那个音频文件的准确记录。我希望能够在这个特定的文字记录中得到每个单词的时间戳。 我不想要不准确的演讲的时间戳。我已经可以这样做了,这是有用的,但由于语音识别中的错误,它还不够好。 有没有人知道谷歌语音识别是否有可能做到这一点?
浏览 3
提问于2020-04-25
得票数 1
1
回答
是否有可能利用Windows 10的用于Python的Cortana?
、
、
、
、
我目前正在从事一个家庭自动化项目。当Windows 10发布时,我的语音识别API变得不兼容了。是否有公开可用的API来使用Cortana,如果没有,是否可以使用语音识别API? Python2.7 Windows 10的蜻蜓语音API不再工作,它使用的是windows语音识别。 我的最终目标是不使用一个启动短语,我希望我的人工智能听我说的一切。如果我随便问一个问题,我想要一个答案。我有人工智能部分涵盖,但语音输入它是我最大的问题。 谢谢你的帮助,我期待着答案! (注:由于Windows 10的复杂性,这不是一个重复的问题。)
浏览 2
提问于2015-08-16
得票数 3
回答已采纳
1
回答
Python中的语音识别
、
、
我目前正在开发Python3.3中的一个虚拟助手程序,我想在其中加入语音识别功能。有没有人知道有什么python模块或工具可以做到这一点?任何帮助都将不胜感激!
浏览 0
提问于2013-07-11
得票数 4
2
回答
创建语音聊天应用程序需要指导
、
、
、
、
我想创建一个语音聊天应用程序作为一个项目的一部分。然而,对于要使用的编程语言和所涉及的技术,我完全缺乏方向。 有人能指点我该怎么做吗? 以下是我需要的功能: 用户对用户语音聊天 会议聊天能力(超过2个用户) 如何将一个用户连接到另一个用户?如何处理语音传输?如何在会议中有效地路由数据包? 我认为最有可能开发这个的语言是Flash。欢迎任何建议。
浏览 3
提问于2010-05-17
得票数 0
1
回答
树莓Pi的语音识别
、
、
我正在研究一个需要语音识别的机器人项目。我希望成品是便携式的,所以它几乎肯定会使用覆盆子Pi。是否有在Pi上高效运行的语音识别软件(或语音识别库)? 要求: 是为了英语。 在Pi上高效运行。 是..。 ...able将在源代码级别进行修改(以运行机器人),或 ...a库,这样我就可以自己制作程序了。 是免费的还是便宜的。 不需要上网。
浏览 0
提问于2014-03-04
得票数 6
回答已采纳
2
回答
用于登录web应用程序的语音识别
、
、
我正在创建一个web应用程序,用户应该通过语音识别作为密码注册该应用程序。应识别语音以进行授权。有没有办法通过Java语言实现语音识别? PS:如果用户提供语音,那么语音应该能够识别已经存储的语音,并能够登录应用程序。
浏览 2
提问于2014-12-26
得票数 2
2
回答
Google语音API与Web语音API的区别
、
我正在研究网络语音识别。 我发现Google为开发者提供了一个名为“V2”的API。但是我注意到每天使用它是有限度的。 之后,我发现有一个本地的WEB语音API也可以实现语音识别。它只是在google chrome和opera上工作: 那么,Google语音API和Web语音API有什么不同呢?他们有关系吗? 语音识别结果json是从谷歌回来的。谷歌语音api会比网络语音api更精确吗? 谢谢。
浏览 2
提问于2015-09-11
得票数 17
回答已采纳
2
回答
找到一个简单的语音引擎
、
、
、
我在做一个关于文本识别的项目。这里的要点之一是识别后的文本到语音的翻译。你能帮我找到一个非常简单的,C++ Builder项目的简单语音引擎吗?我所发现的不仅非常复杂,而且它们也适用于MFC。 所以,问题是我想把文本转换成语音。没有识别,只是简单的转换。请分享一些关于这个问题的信息,也许我应该找个地方查一下? 基本上,我甚至不知道,如果我说的是对的,所以我很抱歉,如果它发生了误解。
浏览 3
提问于2012-01-14
得票数 1
回答已采纳
1
回答
如何向语音识别器提供要查找的单词列表
、
有没有办法让android的语音识别器只从联系人列表或任何预定义的列表中捕捉单词?例如:我希望用户说出一个名字,而不是查看无用的单词,语音识别器会尝试从联系人列表中找到匹配的单词。
浏览 1
提问于2013-08-22
得票数 1
1
回答
非英文窗口系统上语音识别
、
、
、
我无法在我的荷兰语windows系统上使用语音识别应用程序,因为它只在英文版本上可用。 现在我想使用c#将语音识别集成到winforms应用程序中,当然我更喜欢英语。 这个是可能的吗?有这样的库吗?
浏览 1
提问于2013-11-05
得票数 2
1
回答
有没有开源的android语音识别应用程序?
、
有没有开源的android语音识别应用程序?如果可用,请提供参考资料。
浏览 1
提问于2012-03-05
得票数 0
回答已采纳
2
回答
什么是VoiceXML?
、
在寻找一种在flash中使用语音识别的方法时,我遇到了VoiceXML。我已经看过了W3C对它的描述,但我仍然有一些很大的疑问。 我可以简单地创建一个vxml文档并将其放在我的Can服务器上吗?要求是什么? 它会起作用吗? 我可以在互联网上用麦克风输入吗? 我似乎找不到一个直接的答案。
浏览 1
提问于2010-03-10
得票数 1
2
回答
是否有用于Ubuntu桌面的语音识别软件(带有GUI)?
、
、
Ubuntu有什么语音识别软件吗?我在找有GUI的东西。
浏览 0
提问于2014-01-02
得票数 8
2
回答
在另一台计算机上重用语音识别训练配置文件
、
、
、
我在Android中开发语音到文本转换应用程序。其基本思想是在android中录制语音,并将录制的wav文件发送到服务器。 在服务器端,我创建了一个使用Microsoft语音识别API的C#服务应用程序。该服务从Android设备接收音频wav文件,将其转换为文本,并将识别出的文本发送回Android设备。 这可以很好地工作,因为我已经多次训练过语音识别API。 现在我的问题是:我可以在另一台计算机上使用已经训练好的语音识别配置文件吗?
浏览 1
提问于2012-10-09
得票数 0
1
回答
如何在cocoa中确定一个录制文件中的语音数量?
、
、
、
我想要提取信息,比如在一个录制的文件中每个人有多少声音。 我知道NSSpeechRecognizer类可以识别语音,但无法知道一个录制文件中的语音数量。 请提供一些建议。 谢谢,Yogesh Arora
浏览 0
提问于2014-11-20
得票数 0
2
回答
有人有Sphinx语音识别的经验吗?
、
、
是否有人使用语音识别堆栈来构建IVR应用程序?我正在寻找开源的替代品,而不是昂贵的和有一定限制的MSFT和其他选择。我还没有找到一个将开源语音/voip应用程序捆绑在一起的综合软件包。
浏览 1
提问于2008-08-30
得票数 3
回答已采纳
5
回答
MP3/WAV到文本(语音识别)
、
我正在寻找一个软件( Windows或Linux),可以将MP3/WAV文件转换为文本。 可以通过语音识别自动生成文本的内容,如YouTube上的自动字幕,但可以将这些字幕输出到文本文件中。
浏览 0
提问于2015-06-28
得票数 13
5
回答
用于嵌入式应用的语音识别引擎
、
、
、
我正在尝试研究可用于开发支持Windows CE语音的应用程序的语音识别引擎和SDK。我遇到过Nuance,但没看到什么其他的。如果可能的话,我更喜欢.Net开发工具包,但我想大多数都是C/C++。我很感谢你的建议。谢谢。
浏览 0
提问于2009-12-08
得票数 4
回答已采纳
4
回答
基于说话者的语音识别引擎
我想做一个小应用,有没有人知道一个好的依赖于说话人的语音识别引擎与sdk。(不是语音到文本引擎) 谢谢, Efrat
浏览 0
提问于2010-01-19
得票数 0
3
回答
是否可以通过语音识别登录?
、
虽然我喜欢面部识别,但我更喜欢使用语音识别登录。有可能吗?如果可能的话,我该如何设置软件?
浏览 0
提问于2012-03-31
得票数 62
1
回答
什么是好的语音识别软件?
我正在运行Lubuntu15.04,我正在寻找一个语音识别软件,允许我打开和运行我的声音文件。在那里我可以定制,如果我说,因为我想要一个骑士凯特汽车的语音识别,我想要能够与汽车交谈。就像我说“嘿凯特”。当我说“嘿Kitt”时,它会打开一个音频文件并播放我选择的音频文件。有什么建议吗?
浏览 0
提问于2015-06-25
得票数 0
3
回答
有没有简单的VAD实现?
、
、
、
、
我正在寻找一些用于VAD (语音活动检测)的C/C++代码。 基本上,我的应用程序是从设备读取PCM帧。我想知道用户什么时候在说话。我不是在寻找任何语音识别算法,而只是为了语音检测。 我想知道用户什么时候说话,什么时候说完: bool计数( size_t *isVAD,bool count);
浏览 3
提问于2011-03-20
得票数 15
回答已采纳
2
回答
AOSP 7.1.1语音识别器可用性
、
、
我已经构建了AOSP 7.1.1,并且我在模拟器中注意到,在语言和输入菜单中,在语音部分只有文本到语音项是可用的。因此,语音输入项不存在。这使我认为AOSP中没有语音识别器。不过,我还是需要官方的确认。 你能证实我的假设吗?是否有与此主题相关的官方Google文档?(我更喜欢正式文件,因为更容易查阅) 编辑:更清楚的是,我对服务本身的可用性感兴趣--它是否在AOSP中实现。 附加信息:我看到AOSP提供了用于处理语音识别的APIs,但是没有关于服务的可用性的信息。 谢谢
浏览 3
提问于2017-06-13
得票数 1
回答已采纳
4
回答
iPhone应用>是否添加语音识别?
、
、
、
我想构建一个使用语音识别的应用程序。我已经看到像Google等大公司实现了这一功能,但我很好奇在初创阶段做这件事。有人调查过这个吗?有什么工具可以让我们做到这一点吗?
浏览 0
提问于2009-06-02
得票数 15
1
回答
基于HMM或MFCC的语音识别
、
、
、
请帮助我在语音识别使用HMM (隐马尔可夫模型)或MFCC (梅尔倒谱系数)由longage c#或c++我想识别单词“一”,“二”…到"ten")当我说one ===> MessageBox write one
浏览 2
提问于2016-04-27
得票数 0
1
回答
最快的语音识别库C++
、
、
、
、
我知道这是一个一般性的问题,但我仍然想知道C++中最快的语音识别库是什么? 目前我正在使用Microsoft SAPI和kniect。它工作得很好,可以识别单词,但有点慢,有时需要1,2秒才能识别一个单词,在我的例子中,这种延迟会给用户带来很多交互问题。 我检查了随kinect提供的样本,其中乌龟根据识别的单词向左向右移动,但即使这样也有点慢。 所以我想知道有没有比sapi更快的库,它可以用在像机器人使用语音识别的情况下你说“左”然后“右”但机器人在1,2秒后继续左转右转这对用户来说有点令人沮丧。
浏览 13
提问于2013-04-05
得票数 19
1
回答
Jelly bean离线语音识别可以在带仿真器的系统(PC)中使用吗?
、
、
、
、
我想知道是否可以在系统中使用android jelly bean的离线语音识别功能?就像我安装android虚拟模拟器,然后安装jelly bean,下载离线语音识别,然后我可以通过任何方式在我的pc上使用它。就像我做一些代理工作一样,它可以与桌面应用程序的记事本/文本编辑器一起使用吗?我知道桌面应用程序不支持文本输入。但我只是想知道有什么方法可以把语音识别从那个模拟器中拿出来用在PC上?? 谢谢你的回答!!
浏览 1
提问于2013-04-29
得票数 2
2
回答
扩展Sphinx以支持本地语言
、
、
、
最初,我想从头开始编写一个语音识别引擎(支持50-100个单词)来支持我的母语。 然而,经过一些研究后,很明显,即使在1.5年内支持非常有限的语音识别引擎也是不可能的。 现在我正在考虑扩展sphinx引擎来支持我的语言。是否有可能在一年半内完成,或者甚至对于最后一年的项目来说,这是太多的工作。 我正在焦急地等待你关于这件事的经验。
浏览 1
提问于2012-12-13
得票数 3
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
OpenAI 开源语音识别模型 Whisper
如何语音识别翻译?语音识别翻译软件哪个好?
5 款不错的开源语音识别/语音文字转换系统
开源OCR文字识别软件Calamari
谷歌开源Live Transcribe语音识别转文字工具
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
腾讯会议
活动推荐
运营活动
广告
关闭
领券