腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1303)
视频
沙龙
1
回答
如何创建类似voicebase的高亮显示/照明
可以复制在线最终文本,就像这样:,照亮每个单词或短语
浏览 1
提问于2016-05-25
得票数 0
2
回答
是否有任何方法来改变来电者的声音,使声音
识别
不可能?
、
、
我搜索并找到了这篇文章:然而,它并没有回答我的问题。 是否有任何方法改变一个人的声音,足以使手机呼叫无法
识别
的语音
识别
技术?
浏览 0
提问于2019-08-29
得票数 2
1
回答
使用Youtube作为语音
识别
数据集
、
DNNs是一种巨大的数据需求算法,尤其是双向LSTM算法.对于语音
识别
模型,对于特定的语言/口音,缺少语音语料库。然而,YouTube也是一个巨大的库。我需要使用一些脚本/
软件
,它可以自动下载YouTube视频(可能只有
音频
)和相关的字幕,然后将其分割成20秒的片段,这样就可以用作训练语音语料库。 有没有任何方式可以下载来自Youtube的字幕?给出一个
音频
和脚本,我如何将一个
音频
分割成20秒的片段,并在
文字
记录中做同样的剪辑?
浏览 0
提问于2018-12-21
得票数 0
1
回答
非英文窗口系统上语音
识别
、
、
、
我无法在我的荷兰语windows系统上使用语音
识别
应用程序,因为它只在英文版本上可用。这个是可能的吗?有这样的库吗?
浏览 1
提问于2013-11-05
得票数 2
1
回答
[
音频
编解码器]:混音器功能通常是在
音频
编解码器的硬件还是
软件
中实现的?
所谓混音器功能,我指的是在
音频
编码和解码中将通道混合到输出等。这通常是在
音频
编解码器中的硬件还是
软件
中实现的?
浏览 0
提问于2010-12-03
得票数 1
回答已采纳
1
回答
谷歌语音
识别
是如何工作的?
我知道
音频
指纹
识别
音频
文件,这是很棒的,但我真正想知道的是Google是如何制作语音
识别
API的,它们是如何获取
音频
和返回的单词的。我写了一个宝石来指纹wav
音频
文件并对它们进行比较,但是如果我用指纹将我的声音与充满指纹的数据库进行比较,可能要花费很长时间。谷歌是怎么做到的?用途: 我真的很喜欢语音
识别
,我想要一个地方开始编码,但我不知道从哪里开始。DragonVoice是语音
识别
软件
的另一个例子,所有这些
软件
都非常
浏览 5
提问于2014-02-27
得票数 0
回答已采纳
1
回答
实时语音
识别
音源问题?
、
、
、
使用官方提供的实时语音转
文字
demo,可以通过文件流的方式
识别
出
音频
文件的语音并转成
文字
。当
音频
流来源切换到前端调用麦克风实时发送数据,就无法
识别
出
文字
。request.setEngineModelType("16k_zh"); //模型类型为必传参数,否则异常 request.setVoiceFormat(1); //指定
音频
格式.newSpeechRecogniz
浏览 72
提问于2024-04-08
1
回答
同步文本和
音频
。有没有NLP/语音到文本库来做这件事?
、
、
我想要同步语音录音与已知的文本。是否有一个语音到文本/自然语言处理库可以促进这一点?我想我会想要检测单词边界并从字典中计算候选匹配。我发现的大部分问题都与书面语言有关。 我到目前为止发现的是:
浏览 1
提问于2010-11-01
得票数 14
回答已采纳
1
回答
在
音频
文件中查找
音频
剪辑
、
我经常从大的
音频
文件中剪辑
音频
片段,这些文件通常有30到60分钟长。有数百个,可能是数千个这些
音频
文件。通常情况下,一切都很好,但有时我想回去重新听听我摘录的内容背后的一些背景。最近,我在摘录中加入了文件名以供参考,但我想知道是否有任何方法可以搜索
音频
文件。从字面上讲,这不是大多数关于这个话题的结果所提出的“语音
识别
搜索”。我有实际的,准确的原始
音频
,如果我可以让脚本扫描文件夹中的所有
音频
文件,看看剪裁后的
音频
文件是否出现在其中任何一个文件中,那就太棒
浏览 0
提问于2020-12-14
得票数 2
4
回答
ORC
文字
识别
怎么使用下载?
点击进去简介和费用介绍,具体怎么使用操作?
浏览 475
提问于2018-04-10
1
回答
将
音频
文件合并到一个视频中,该视频在播放时显示原始文件名。
、
、
我有一个短
音频
mp3文件列表。是否有任何
软件
可以自动将它们合并成视频,在播放时显示原始
音频
文件的名称?我正在使用Ubuntu,我将在Ubuntu中使用这样的
软件
浏览 0
提问于2014-11-13
得票数 2
回答已采纳
5
回答
MP3/WAV到文本(语音
识别
)
、
我正在寻找一个
软件
( Windows或Linux),可以将MP3/WAV文件转换为文本。 可以通过语音
识别
自动生成文本的内容,如YouTube上的自动字幕,但可以将这些字幕输出到文本文件中。
浏览 0
提问于2015-06-28
得票数 13
2
回答
创建自定义语音命令(GNU/Linux)
、
、
、
、
我正在尝试创建一个用于创建自定义语音命令的
软件
。目标是允许用户/我录制一些
音频
数据(2/3秒),用于定义命令/宏。然后,当用户要说话(录制相同的
音频
数据)时,将执行命令/宏。该
软件
必须能够在低成本计算机(例如RaspberryPi)中在不到1秒的处理时间内检测到命令。我已经通过两种方式进行了搜索:- Speech Recognition (CMU-Sphinx,Julius,simon):有很好的开源解决方案,但它们通常需要大型数据库文件,而语音
识别
并不是我真正想要
浏览 3
提问于2013-03-09
得票数 2
回答已采纳
1
回答
Google语音
识别
时间戳
、
我有一个
音频
文件,而且我有那个
音频
文件的准确记录。我希望能够在这个特定的
文字
记录中得到每个单词的时间戳。有没有人知道谷歌语音
识别
是否有可能做到这一点?
浏览 3
提问于2020-04-25
得票数 1
1
回答
语音
识别
是否支持定位
识别
位置?
浏览 150
提问于2022-06-15
1
回答
语音
识别
支持方言语音转普通话语音吗?
浏览 121
提问于2022-06-15
2
回答
Google语音
识别
库或API
、
、
、
谷歌最近在语音
识别
软件
方面取得了很大进展,该
软件
被用于几个开源产品,例如Chromium 和Android免提短信。我想使用他们的语音
识别
作为我的服务器堆栈的一部分,但我找不到太多关于它的信息。文本
识别
软件
是否以库或
软件
包的形式提供?或者,我可以从另一个程序调用chromium,将一些
音频
文件转录成文本吗?
浏览 3
提问于2013-03-23
得票数 3
1
回答
提取
音频
文件的二进制表示
、
、
、
我想从一个
音频
文件(可能记录在audacity中)中提取出确切的二进制实现。我想要这个提取这些表示,以
识别
语音和声音,即一个基本的语音
识别
软件
。编辑-我想获得
音频
的波形,而不是图形,而是二进制表示,这样我就可以将语音转换为文本。
浏览 2
提问于2012-03-05
得票数 0
2
回答
在哪上传
音频
文件?
、
请描述您的问题 [附加信息]
浏览 829
提问于2018-09-26
1
回答
不转码地分割OGG和M4A
音频
文件
我正在寻找一些(免费或付费)
软件
,API或编程库(任何编程语言)分裂OGG和M4A
音频
文件,无需转码。 我的意思是:把一个10分钟的
音频
文件分解
成
两个文件,一个是4分钟,另一个是6分钟。
浏览 0
提问于2019-01-30
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎么将音频转换成文字?可以识别音频为文字的软件有哪些
录音转文字免费的软件哪个好用?推荐这些识别音频文字的软件
音频转文字软件哪个好?音频转文字软件大分享
音频转文字软件哪个好?有没有音频转文字的软件?
音频识别转文字软件有哪些?三款软件教你录音转文字怎么弄
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券