语音识别转换文字软件_识别语音文字软件_语音识别文字软件 - 腾讯云开发者社区

、、

我搜索并找到了这篇文章：是否可以用语音识别来识别手机用户？然而，它并没有回答我的问题。是否有任何方法改变一个人的声音，足以使手机呼叫无法识别的语音识别技术？

浏览 0提问于2019-08-29得票数 2

2回答

基于Visual Basic 6的语音识别

有一种方法可以在Visual Basic 6项目中集成语音识别吗？

浏览 2提问于2010-05-22得票数 1

回答已采纳

7回答

目前国内的语音识别技术达到了什么水准？还存在哪些问题？

现在技术越来越厉害了，前几年还感觉语音打字特别不靠谱，各种语音助手也相当蠢萌，想问下现在国内语音识别发展到什么水平了？实时且准确的将语音转化成相对应的文本已经达到了什么样的水准？主要还存在哪些方面的问题？

浏览 2288提问于2018-08-06

1回答

iPhone中的语音识别

、

语音识别是iPhone音频的一部分吗？我想为iPhone构建一个关于语音识别的示例代码。如何开始？请给我一些想法。在iPhone应用程序开发人员中有关于语音识别编程的文档吗？谢谢,

浏览 3提问于2010-07-01得票数 0

回答已采纳

2回答

用于登录web应用程序的语音识别

、、

我正在创建一个web应用程序，用户应该通过语音识别作为密码注册该应用程序。应识别语音以进行授权。有没有办法通过Java语言实现语音识别？ PS:如果用户提供语音，那么语音应该能够识别已经存储的语音，并能够登录应用程序。

浏览 2提问于2014-12-26得票数 2

2回答

Google语音API与Web语音API的区别

、

我正在研究网络语音识别。我发现Google为开发者提供了一个名为“V2”的API。但是我注意到每天使用它是有限度的。之后，我发现有一个本地的WEB语音API也可以实现语音识别。它只是在google chrome和opera上工作：那么，Google语音API和Web语音API有什么不同呢？他们有关系吗？语音识别结果json是从谷歌回来的。谷歌语音api会比网络语音api更精确吗？谢谢。

浏览 2提问于2015-09-11得票数 17

回答已采纳

2回答

Windows语音识别软件，以音频文件为输入，输出文本文件

、、

我对用于Windows的语音识别软件感兴趣，它以一种标准格式(MP3、WAV、OGG等)获取播客的音频文件，并将语音的转录作为文本文件输出。其动机是帮助为官方wiki录制播客。我希望它能够教它，提高语音识别，或学习新单词。此外，它应该能够处理多人交谈，偶尔重叠的讲话，偶尔的音乐，或非说话的声音。我只需要这个软件来处理英语。

浏览 0提问于2014-04-14得票数 5

3回答

OSX的语音识别库？

、、、

所以我一直在网络上寻找Python语音识别，我找到了pyspeech。但这只适用于Windows。我想要一个语音识别库，与Mac aswel一起工作。谢谢!

浏览 2提问于2012-06-21得票数 3

回答已采纳

1回答

如何向语音识别器提供要查找的单词列表

、

有没有办法让android的语音识别器只从联系人列表或任何预定义的列表中捕捉单词？例如:我希望用户说出一个名字，而不是查看无用的单词，语音识别器会尝试从联系人列表中找到匹配的单词。

浏览 1提问于2013-08-22得票数 1

1回答

非英文窗口系统上语音识别

、、、

我无法在我的荷兰语windows系统上使用语音识别应用程序，因为它只在英文版本上可用。现在我想使用c#将语音识别集成到winforms应用程序中，当然我更喜欢英语。这个是可能的吗？有这样的库吗？

浏览 1提问于2013-11-05得票数 2

4回答

基于语音识别的游戏

、、

由于重复的压力伤害，我想限制我的使用键盘和鼠标。是否有完全(或几乎完全)基于语音识别的游戏？我更喜欢策略或角色扮演游戏。我对基于Windows或Linux的产品都没意见。

浏览 0提问于2014-08-11得票数 4

2回答

我在Android中开发语音到文本转换应用程序。其基本思想是在android中录制语音，并将录制的wav文件发送到服务器。在服务器端，我创建了一个使用Microsoft语音识别API的C#服务应用程序。该服务从Android设备接收音频wav文件，将其转换为文本，并将识别出的文本发送回Android设备。这可以很好地工作，因为我已经多次训练过语音识别API。现在我的问题是:我可以在另一台计算机上使用已经训练好的语音识别配置文件吗？

浏览 1提问于2012-10-09得票数 0

4回答

基于iPhone的语音识别

、

我需要开发一个识别语音的iPhone应用程序，并根据结果执行进一步的任务。我知道iPhone 3.0不支持语音识别，我需要在服务器端实现语音识别软件。我只知道这件事，因为我是新手，我不知道如何处理它。是指我需要购买哪些软件并在服务器端实现它，以及如何使用该服务?？

浏览 2提问于2009-07-13得票数 6

3回答

使用app inventor进行语音识别

android手机可以使用app inventor识别录制的语音吗？我不知道如何将我录制的语音与语音识别相匹配来激活警报。

浏览 26提问于2017-06-30得票数 0

3回答

是否可以通过语音识别登录？

、

虽然我喜欢面部识别，但我更喜欢使用语音识别登录。有可能吗？如果可能的话，我该如何设置软件？

浏览 0提问于2012-03-31得票数 62

1回答

什么是好的语音识别软件？

我正在运行Lubuntu15.04，我正在寻找一个语音识别软件，允许我打开和运行我的声音文件。在那里我可以定制，如果我说，因为我想要一个骑士凯特汽车的语音识别，我想要能够与汽车交谈。就像我说“嘿凯特”。当我说“嘿Kitt”时，它会打开一个音频文件并播放我选择的音频文件。有什么建议吗？

浏览 0提问于2015-06-25得票数 0

5回答

MP3/WAV到文本(语音识别)

、

我正在寻找一个软件( Windows或Linux)，可以将MP3/WAV文件转换为文本。可以通过语音识别自动生成文本的内容，如YouTube上的自动字幕，但可以将这些字幕输出到文本文件中。

浏览 0提问于2015-06-28得票数 13

1回答

蔚蓝语翻译:如何激活识别只有当语音被检测到？

、、、、

我目前正在开发一个实时翻译网络应用程序，允许多个参与者使用，并以多种语言分享他们的转录。我不想被告知参加会议的人数x会议的持续时间。因此，问题是：，当检测到语音时，我如何才能激活识别？这样的话，我只会为目前说话的人付钱。我尝试使用来自的事件，但只有当识别器当前正在识别时(使用recognizeOnceAsync()或startContinuousRecognitionAsync())，此事件才会触发。，在Speech中有什么参数可以用来实现我想要的吗？如果没有，我的选择是什么？这可能是可能的观看音频dB水平，并激活连续识别相应，但我认为我会遇到一些问题，如果我尝试这样做。例句:一旦音频

浏览 5提问于2021-02-08得票数 1

1回答

谷歌语音识别是如何工作的？

我知道音频指纹识别音频文件，这是很棒的，但我真正想知道的是Google是如何制作语音识别API的，它们是如何获取音频和返回的单词的。我写了一个宝石来指纹wav音频文件并对它们进行比较，但是如果我用指纹将我的声音与充满指纹的数据库进行比较，可能要花费很长时间。谷歌是怎么做到的？用途：我真的很喜欢语音识别，我想要一个地方开始编码，但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子，所有这些软件都非常快。我想知道从音频记录到转换成文本的服务器流。

浏览 5提问于2014-02-27得票数 0

回答已采纳

1回答

Jelly bean离线语音识别可以在带仿真器的系统(PC)中使用吗？

、、、、

我想知道是否可以在系统中使用android jelly bean的离线语音识别功能？就像我安装android虚拟模拟器，然后安装jelly bean，下载离线语音识别，然后我可以通过任何方式在我的pc上使用它。就像我做一些代理工作一样，它可以与桌面应用程序的记事本/文本编辑器一起使用吗？我知道桌面应用程序不支持文本输入。但我只是想知道有什么方法可以把语音识别从那个模拟器中拿出来用在PC上?？谢谢你的回答!！

浏览 1提问于2013-04-29得票数 2

2回答

腾讯一句话语音识别为什么识别不了微信公众号临时下载的语音？

、

由于一句话语音识别可以识别MP3、wav等格式的语音，不支持amr格式的语音识别被识别文件类型由 .amr在下载保存文件的时候转换成了.wav类型具体表现为：识别返回{"Response":{"Result":"","RequestId":"d8f29672-34f9-4122-b3c0-1e1bcb82e4f4"}} 请问是什么原因？

浏览 707提问于2019-08-08

1回答

Microsoft语音识别默认值与API

、、、

因此，我一直在Windows10中使用微软语音识别，做训练练习，将文本口述到写字板中并进行更正，向字典中添加单词等等。我想用这个软件来转录.wav文件。似乎可以使用Windows语音识别API来做到这一点，但这似乎涉及到创建和加载自己的语法文件，这向我表明，这基本上将创建一个新的语音识别器，它使用相同的构建块，但与我在开始菜单中单击“开始语音识别”时运行的程序不同。特别是，由于训练或配置的不同，它的性能会有所不同。这一点我说错了吗？如果不是，是否还有一种方法可以检索默认语音识别器使用的所有数据，以便我可以准确地再现它的行为？如果我需要创建一个单独的语音识别器，它有自己的语法文件和单独的训练历

浏览 5提问于2016-03-18得票数 1

1回答

.3gp或wav格式录音音频文件的语音识别

、、、

可能重复：我正在开发一个Android应用程序，它可以将音频记录到文件中，然后使用语音识别从录制的语音中获取文本。是否有用于这类任务的语音识别库？我怎么开始呢？

浏览 1提问于2012-12-30得票数 7

1回答

WCAG2.0和语音识别，是A，AA还是AAA

、、

我想问你，语音识别软件站在哪里的网页可访问性。我的意思是，它是WCAG A，或AA，或AAA的一部分。我试着理解W3C在这里解释了什么：但我迷路了5次左右。我之所以问这个问题，是因为我的客户问我们是支持A级还是AA级，我觉得语音识别软件处于AAA级。如果有人能帮我，那就太好了:)

浏览 2提问于2015-08-06得票数 1

回答已采纳

3回答

谷歌语音识别源代码

、、

正如谷歌所说，新的安卓“果冻豆”将包含能够离线工作的语音识别引擎。随着新的android源代码的公开，我试图寻找并找到语音识别引擎的源代码，但没有成功。所以我的问题是:语音识别引擎的源代码是android 4.1.1源代码的一部分吗？或者它是一个独立的应用程序？提前感谢并为我的英语表达歉意。

浏览 3提问于2012-07-11得票数 4

1回答

在android软键盘上激活语音到文本时，会触发哪个事件？

、、

当默认语音识别按钮在android软键盘上被触摸时，我想在android应用程序中触发另一个事件。是否有任何方法捕捉此事件，或者语音识别按钮直接修改keyboard.xml的代码是什么？任何解决方案都将不胜感激，谢谢。

浏览 0提问于2014-07-15得票数 2

回答已采纳

1回答

开发一款听觉训练软件，用什么工具好？

想开发一款听觉训练的软件。有一关关的题目，文字加上声音，让受试者回答问题。答对给奖励积分，可累积。根据回答的情况来做数据收集和分析。得出分析报告。有些问题需要语音回答，需要识别语音来判断正误。这样一个软件用什么工具来开发好？

浏览 304提问于2018-09-10

1回答

Ubuntu中有用于电话的语音识别吗？

、

Ubuntu能够识别语音命令吗？什么类型的语音识别是内置的，它在Ubuntu桌面上是可用的吗？

浏览 0提问于2013-03-02得票数 3

3回答

如何在iphone中通过编码识别人声？

、、、

我想在我的iPhone应用程序中集成语音检测功能。iPhone应用程序允许用户使用自己的语音搜索单词。但是，我对iPhone中的语音识别一无所知。你能为我提供任何想法，教程或示例代码吗？

浏览 2提问于2012-02-11得票数 0

回答已采纳

15回答

您的交互式语音应答平台是什么？

、、、

对于那些在语音领域工作的人来说，你们使用什么作为IVR平台？我使用的是Microsoft Speech Server 2007。一些等价的包是什么？是否有人使用开源软件来处理入站或出站呼叫？请注意，我不仅仅是在谈论语音识别，它是一个综合软件包的一个组件。语音识别平台将包括语音识别、文本到语音转换、诸如VoiceXML之类的VUI技术，以及通过SIP或电话硬件的呼叫终止。

浏览 29提问于2008-08-14得票数 4

1回答

Chrome语音API和google语音API有什么区别？

、、、

我一直在尝试将语音识别stt集成到我的项目中，在尝试了其中的各种方法之后，我发现chrome的本地web语音API是最好的。与谷歌的语音API相比，它的性能和准确性如何？

浏览 4提问于2016-12-20得票数 3

回答已采纳

1回答

Android语音识别API

、、

我正在开发一个应用程序，它需要语音识别保持活动状态一整分钟。在查看文档时，我发现"SPEECH_INPUT_MINIMUM_LENGTH_MILLIS“添加到了2.2。然而，谷歌默认的语音识别服务似乎并不支持它。有没有人知道我可以强制语音识别持续一分钟的方法？

浏览 0提问于2010-09-01得票数 1

回答已采纳

1回答

语音识别中的新语言

、、

我对语音识别应用程序和算法很感兴趣，但实际上还没有将它们用于开发。我有几个问题，非常感谢你的建议。我想我需要知道:现在有哪些开源软件？(Google的语音搜索程序是否使用任何开源的语音识别软件？)现有的语音识别软件，即使是付费的，是否提供了添加要识别的新语言的接口？ (我更喜欢查找/使用可以添加到移动应用程序中的库) 如果你认为知道其他事情会更好，请让我知道！！非常感谢大家。阿尔森

浏览 3提问于2014-09-04得票数 0

1回答

用基于java的逻辑编写TinyMCE自定义插件

、、

我是插件开发方面的新手，对于我正在从事的一个学校项目，我需要开发语音到语音功能，它允许用户将语音输入到文本编辑器中，在这种情况下，我只能使用TinyMCE编辑器。我得到了一个已经开发得很好的java语音识别库，我的名字是CMU Sphinx- sphinx4。所以现在我的问题。Sphinx4是一个java库，它包含了创建插件所需的所有逻辑。但是使用TinyMCE，我只能用javascript编写插件。我试着写了一个简单的演示，没有成功地让插件工作。下面是代码片段 Index.html <!DOCTYPE html> <html> <head>

浏览 1提问于2018-05-22得票数 0

1回答

为有声读物中的字幕创建时间戳

、、

我想添加时间戳到书籍句子，适合相关的有声读物。最好是用不同的语言。这里有一个例子：骄傲和偏见我的想法是找到一个语音识别工具，将时间戳放在句子上(步骤1)，然后使用levenshtein距离将杂乱的文本映射到原始文本(步骤2)。网站为第一步提供了一个解决方案，但它的字符输出是有限的。从理论上讲，我可以使用网络自动化来完成这项工作，每分钟开始一次新的录音，但它真的很脏。我在R中编写了第二步的脚本，并在我从语音记录器获得的一个样本上测试了它，它运行得很好，但是如果程序知道文本，就像你阅读来训练语音识别软件时，这一点可以得到很大的改进。我不是把我所有的信息都用在转录上。所以我的问题是，

浏览 4提问于2016-01-25得票数 1

回答已采纳

2回答

关键词是否影响布鲁斯沃森语音识别？

、、

沃森的语音识别器支持作为参数的关键字列表，但我试图弄清楚这些关键字是否真的会影响识别。例如，如果您正在给Watson一个音频剪辑，其中包含可能无法正确识别的正确名称，那么将这些名称作为关键字提交会增加Watson正确识别它们的可能性吗？关键词与识别本身相互作用吗？

浏览 2提问于2016-04-12得票数 0

回答已采纳

1回答

为封闭词汇表构建语音识别

我可以使用下面的链接为我有限的单词集创建语音识别。但是，我如何向语言模型提供反馈，以便更好地训练我的声音。例如，.dic文件中的拼音值是针对美国口音的(我想将其训练为印度口音)。

浏览 3提问于2013-12-01得票数 1

1回答

华为自动语音识别限制-拾取用户界面上服务不可用错误

、、、、

我正在为华为应用程序库开发翻译应用程序，我通过了解到自动语音识别目前支持11种语言自动语音识别(ASR)可以识别不超过60年代的语音，并将输入的语音实时转换为文本。该服务采用行业领先的深度学习技术，识别准确率超过95%.目前，汉语普通话(包括中英双语)、英语、法语、德语、西班牙语、意大利语、阿拉伯语、俄语、泰语、马来语和菲律宾语可以被认可。但另一方面，支持40种语言。我使用ASR转换，但29种语言代码在实时翻译显示服务不可用的皮卡UI。什么应该是其他的选择，我可以用以实现对其他语言的转换。华为在不久的将来会支持其他语言吗？

浏览 7提问于2021-10-08得票数 2

1回答

限制语音识别字典以实现更快的匹配和更好的准确性

、、、

我正在尝试制作一个基于android的应用程序，其中一个部分是语音识别。我有一个非常有限的语音命令，应用程序将在其上工作。因此，我想以某种方式限制字典或创建一个新的字典的单词将由应用程序使用，以便应用程序将具有非常好的准确性和更快的匹配。例如。如果我说"B"，结果可以是"B“、" be”或"Bee“，但我的应用程序应该只查找"B”，而不是任何其他类似的声音。如何在android中做到这一点？编辑:我是android的新手，到目前为止，我只是通过在网上阅读教程来应用基本的谷歌语音识别。认真地说，我需要一些提示来完成这项任务，这样我就不会浪费更多的

浏览 1提问于2013-11-25得票数 4

1回答

比较两种语音

、、

我需要能够确定两个声音是否非常相似。我们的目标是拥有一个非常有限的单音节或双音节单词的词汇表(10或15)，然后比较捕获的声音，以确定它是否是环境和捕获条件中所有常见变化性的项目之一。其想法是，用户可以通过语音发出一些简单的命令，而不是键盘或鼠标。有人知道解决这个问题的最好方法吗？我不想做完全成熟的语音识别，只想做一些更有限的事情。

浏览 0提问于2010-05-29得票数 4

回答已采纳

1回答

facebook机器人中的语音识别

在开发facebook机器人时，语音识别选项可用吗？我在developers.facebook.com中找不到任何与语音识别相关的文档但是我可以看到FB已经购买了用于语音识别的Wit.ai。它正在开发中吗？

浏览 1提问于2016-08-23得票数 0

2回答

Android应用无需按键即可识别语音

、、、

我希望添加语音命令到Android应用程序，将在平板电脑上作为一个信息亭运行。我不希望用户必须按下按钮，因为用户正在做一些更重要的事情(例如，驾驶汽车、驾驶飞机或进行脑部手术)，而命令可以通过按一下按钮来完成。我看到一些教程描述了如何将语音添加到文本中，并让用户按下按钮获取文本，但没有任何教程允许唤醒单词“to，Google”启动语音识别(更不用说自定义唤醒单词了)。我考虑过使用Google Voice Actions以“on，Google”开始，然后发送一些东西到我的应用程序(注册一个意图)，但这必须针对一个特定的用户(至少对于我尝试过的平板电脑)。我每天都会有不同的用户(可能一天不止一

浏览 44提问于2018-02-16得票数 0

回答已采纳

2回答

将音频作为麦克风输入播放

、、

我要测试语音识别程序。有些是我有权访问代码的，有些是我没有的。可悲的是，我(优美的)声音并不完美，所以当我读一篇文章时，每次听起来都略有不同。这使得测试变得困难和耗时。鉴于此，我可以调整很多参数。所以我想知道有没有办法录下我自己的声音(已经录好了)。然后将其作为正常的麦克风输入播放，以便我正在测试的语音识别程序将其视为麦克风输入。如果可以在C#中以编程方式完成，这也会有很大帮助。所以我可以在我自己的代码中指定何时播放什么。从扬声器播放它并让语音识别程序收听麦克风是不可行的，因为它在不同的计算机/扬声器/麦克风上是不同的声音。谢谢。编辑:到目前为止，我所发现的是使用软件声卡模拟器。但

浏览 2提问于2013-12-13得票数 53

回答已采纳

3回答

C# System.Speech未找到！

、

我正在尝试使用与此相关的语音识别：但是系统找不到它的程序集。

浏览 1提问于2011-05-03得票数 8

回答已采纳

2回答

在Google应用程序上设置语音识别上下文？

、、

我有一个Google应用程序，它使用Google客户端Javascript库上的操作：语音识别效果非常好。但有时我会遇到一种认知环境，它有一些小麻烦。有没有办法告诉语音识别设施，以强调在每个用户交互的基础上特定短语的概率？例如，如果用户被要求指定一个日期，那么一年中的几个月的概率就会超过正常值吗？在一些语音识别引擎中，您可以提供词汇表(也称为语法等等)。到引擎上。有没有办法用谷歌应用程序的动作来做到这一点呢？我知道谷歌的语音识别API：但我不知道该API是公开的还是通过Google服务上的操作获得的，或者该API是否支持语法或上下文列表。

浏览 2提问于2017-10-13得票数 2

2回答

如何在Visual Studio 2019中添加语音识别

、、、

我想在visual studio 2019的C#中创建一个语音识别程序，但是当我单击添加引用时，我不知道如何添加语音库，它没有给我提供从程序集添加的选项。如何在添加引用时显示程序集选项卡？

浏览 0提问于2019-12-17得票数 0

1回答

在iOS中将语音转换为文本

、

我正在寻找一个示例示例，它实现了open或任何其他语音识别器来将语音转换为文本。有什么教程可以帮我把课文转换成语音吗？

浏览 2提问于2013-05-03得票数 0

2回答

语音识别接口SDK (Android)

、、

我需要做一个Android应用程序，可以识别我创建的某些声音文件，并在识别时执行操作。所以类似于Shazam/Soundhound的东西，但有我自己的声音文件。有没有什么API或者SDK之类的东西？我读过关于Echoprint的文章，但我知道它适用于Windows和iOS，这对我来说似乎相当困难。这样行得通吗？或者还有其他选择吗？ PS:为了清楚，我不想要语音识别，或者文本到语音转换。我的声音文件可以有音乐，失真的声音，效果等

浏览 2提问于2013-06-20得票数 11

回答已采纳

2回答

有没有语音认证库？

、

有没有人知道有没有好的语音认证库？或者我需要找到一个好的语音识别库并在此基础上构建？

浏览 1提问于2011-09-01得票数 15

回答已采纳

1回答

如何在.NET中将AMR声音流转换为PCM未压缩流

、、、、

我需要转换一个AMR (自适应多速率)音频文件记录在一个电话(作为一个流对象)到一个PCM未压缩的wav音频流，以便它可以处理后进行语音识别。语音识别不喜欢AMR格式。这将是一个使用Microsoft语音平台的服务器应用程序。我不确定是否使用ffdshow或类似的库。现在，我正在研究NAudio和DirectShowNet，看看他们是否能帮助我完成这一任务，但我希望有人能指出正确的方向。

浏览 4提问于2010-10-07得票数 2