腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
1
回答
语音识别-录音文件识别请求状态怎么查询?
请问大佬们, 录音文件识别中,如何利用response或者其他对象获取服务器有没有将录音文件识别完成?
浏览 181
提问于2022-04-01
1
回答
是否可以使用Apple Watch在后台录制音频(屏幕关闭)?
、
、
、
题目是题目。我在watchOS中找不到任何与音频背景模式相关的迹象。然而,苹果宣布 使用新的背景模式进行导航和录音。 在促销watchOS 4页。
浏览 5
提问于2017-10-17
得票数 3
回答已采纳
2
回答
录音文件识别是否就是离线语音识别?
浏览 765
提问于2019-03-11
1
回答
使用语音翻译(speechTranslate)的时候,我该如何知道那段语音源语言是中文还是英文?
、
用户开始录音我该如何知道他的录音内容是中文还是英文,试了腾讯云的 一句话识别 ,它对音频文件的采样率还有单双通道都做了要求才能识别,有没有别的办法?
浏览 429
提问于2019-07-17
1
回答
腾讯云语音识别无法识别微信小程序录音?
、
、
为什么用腾讯云语音识别来识别微信小程序录制的录音文件会提示无效文件?
浏览 379
提问于2020-04-09
1
回答
从较大的音频文件中检索歌曲的软件,作为单独的录音
、
我记录来自网络电台的音频流。 录音通常有一小时长( mpeg或flac格式),每次录音都包含几首歌曲/音乐。 是否有软件可以将录音作为输入,识别/检测单个歌曲的边界(当然是最大的努力),并将每个输入文件中包含的歌曲/片段作为单独的音频文件输出?
浏览 0
提问于2016-11-28
得票数 1
回答已采纳
1
回答
从较大的音频文件中提取单个歌曲
我记录来自网络电台的音频流。 录音通常有一小时长( mpeg或flac格式),每次录音都包含几首歌曲/音乐。 是否有软件可以将录音作为输入,识别/检测单个歌曲的边界(当然是最大的努力),并将每个输入文件中包含的歌曲/片段作为单独的音频文件输出?
浏览 0
提问于2016-11-28
得票数 1
1
回答
录音识别sdk的录音文件如何保存?
、
实时语音识别sdk 的录音文件如何保存?停止识别后如何继续任务?而不是重新开始,类似于暂停功能怎么实现呢?
浏览 574
提问于2019-07-16
2
回答
用腾讯云语音识别功能识别微信小程序录音文件会提示无效的录音文件是怎么回事?
、
、
用recorderManager录制音频,录音文件我尝试过WAV、pcm、MP3等多种格式,也尝试过先将录音文件上传到服务器,拿到新的文件路径后可以下载到本地并播放,但是仍然无法被腾讯云语音识别成功
浏览 622
提问于2020-04-08
1
回答
NAudio -单击删除,就像大容量一样
我已经使用NAudio录制声音,并将其保存为.wav文件。因此,在录音时,有一些声音的振幅很高,这使得录音不合适,也有一些声音可以大胆地看到,但其典型的振幅很高,但却很短。如何识别和跳过它们。我可以在录音前进行声音校准吗? 谢谢sunil
浏览 0
提问于2014-04-09
得票数 0
1
回答
H5页面语音听写识别,想实现调用手机麦克风录音上传?
、
、
、
在做语音听写识别的时候,在H5页面中调用手机的麦克风进行录音,然后将录音文件上传识别,查询多方资料,大多数都是采用getUserMedia这个原生API,但是兼容性不好,在 iOS 11.2以前的Safari和微信内置浏览器都无法支持此API,请问有什么解决方案吗?需要兼容iOS和安卓大部分浏览器及微信内置浏览器
浏览 3251
提问于2018-04-13
1
回答
R中的动态滤波器
、
我有一个数据集销售和另一个数据集促销。促销数据集包含销售促销何时发生的详细信息。现在,我需要识别与特定促销相关的销售数据。 我已经提取了第一行并创建了一个过滤器。 promo.filter="product.no==1100001369 & (customer.state==TN | customer.state==AP) & (cgrp==12 | cgrp==13)" 已尝试 promo.sales<-filter(sales, promo.filter) 我得到以下错误 Error: filter condition does not evaluat
浏览 2
提问于2015-07-27
得票数 3
回答已采纳
1
回答
gmail时事通讯/促销标签?
、
、
我正在尝试使用Gmail API获取促销和时事通讯电子邮件消息。目前,我正在根据发送者请求Gmail API,但并不可行。当使用Gmail API获取消息时,有没有办法识别电子邮件消息是促销消息还是时事通讯消息? 时事通讯或促销信息有没有meta标签? 任何关于这方面的帮助都将不胜感激。 谢谢!J.
浏览 10
提问于2019-03-07
得票数 0
回答已采纳
1
回答
更改ALSA的默认采样输入率
、
、
、
、
我正在为Raspberry pi的语音识别做Jasper项目。问题是,当我用默认设置进行记录时,会产生大量的噪音。在修改录音后,我意识到如果我使用“arecord -r 48000 sample.wav”,录音就会清晰得多,而且我知道我的语音识别会正常工作。 但在我的生命中,我不能将它更改为默认设置(使用ALSA配置)。我已经在配置文件.asoundrc中尝试了各种组合,它所做的就是,它回到了Mono 8000 KHz的录音中,不管我投给它的采样率是多少。 问题是:如何将记录采样率设置为48000,并使其成为默认采样率?恐怕我不得不完全放弃这项工程了。
浏览 0
提问于2016-12-06
得票数 1
2
回答
如何用Python实现录音文件识别?
、
录音文件识别,此文档中最后的PHP代码事例我运行后为何实现不了,密匙相关的均已填好。
浏览 604
提问于2019-07-14
回答已采纳
3
回答
说话人识别API能否识别语音是实况语音还是录制语音?
我想知道如果某人有其他人的语音录音,他们是否可以通过Speaker Recognition API使用该录音来假装自己就是那个人。也就是说,说话人识别API可以识别语音是实时的还是录制的?
浏览 1
提问于2017-04-28
得票数 2
1
回答
如何在UBUNTU的服务器上如何配置环境进行AMR文件的自动解压?
、
问题是这样的,终端产品将压缩格式为AMR的录音文件通过2G移动网络发送到服务器,怎样才能在UBUNTU14.04的镜像系统中完成自动解压成WAV格式的语音文件?然后被语音识别调用?批量的解压,批量调用语音识别!
浏览 334
提问于2018-02-24
0
回答
语音识别中的录音文件识别如何去除时间戳?
、
录音文件API请求参数中的RestTextFormat参数类型都会返回时间戳,我不想返回的识别内容里面有时间戳需要怎么设置?
浏览 90
提问于2023-09-27
1
回答
这个接口支持识别MP3的录音文件吗?
请描述您的问题 标题:RESTful API 这个接口支持识别MP3的录音文件吗? 地址:https://cloud.tencent.com/document/product/441/6201
浏览 303
提问于2018-01-23
2
回答
推广及其类型的数据库设计
、
、
、
、
有一个需要创建促销表的要求,该表可以有多个晋升类型。例如优惠券、宣传代码、礼物等 问题是在创建促销时,如何保存促销类型的外键值,其中每个促销类型都是一个单独的实体,并具有自己的属性。 我脑海中的决议: 为每种晋升类型创建单独的表,以适应晋升与相关类型表(例如: Promotion_Coupon_Relation )之间的关系 在“升级”表中删除“外键”约束,并创建一个列,该列将在每次基于类型创建升级时存储外键值。但在这种情况下,这种关系将不是具体的,将被识别的基础上的推广类型。 PromotionType: PromotypeID,PromoTypeDesc (如:优惠券,Pr
浏览 0
提问于2018-10-03
得票数 0
2
回答
通过ffmpeg或其他应用程序更改声音
、
、
我有一套包含录音的音频文件,我需要改变声音信号,这样扬声器就不能自动识别. 你知道什么申请吗?
浏览 0
提问于2015-01-30
得票数 2
2
回答
录音文件识别的识别结果,如何获取?
$audio_url = "http://www.www.com/1.mp3"; $result = sendUrlRequest("https://www.www.com/callback.php", $audio_url); echo "\n<br>8K UrlRequest result is: " . $result; 上面3行代码,发起了一次录音文件识别的请求。 那么,发起的这次请求,我怎么读取识别完成数据呢? 我不知道识别完成的数据的结构是什么样的,所以每次收到网页调用都在数据库记录一次。并且标出
浏览 637
提问于2019-07-22
1
回答
获取用户的iTunes连接用户名?
、
、
我不是想获取信息,我只是想创造一种方式,为我的用户在应用程序购买中提供自定义促销码,因为苹果不为IAP提供促销码。我正在寻找一种方法来识别用户,当他们从一个设备移动到另一个设备,这样我就可以通过使用我的自定义促销代码之一来解锁他们在应用程序购买中获得的访问权限。 有没有办法以编程方式获得当前用户的iTunes连接用户名?
浏览 1
提问于2012-03-28
得票数 1
回答已采纳
0
回答
一句话识别报错ErrorInvalidVoicedata?
、
PC端通过HZRecorder插件进行的录音文件,调用一句话识别接口总是报"InvalidParameterValue.ErrorInvalidVoicedata",研究了一天了,不知道哪里错了? 下面压缩包里有语音文件和HZRecorder.js 语音.zip
浏览 292
提问于2019-08-31
1
回答
Gracenote Android脱机模式
、
我试图使用Gracenote客户端为android识别音乐通过麦克风。 到目前为止,它运行良好,我收到了识别结果(使用identifyAlbum)。 我想知道,是否有可能支持脱机场景。对指纹进行指纹识别,并将指纹提交给gracenote服务器(当互联网可用时)。 (我知道它可能会将录音存储为音频文件,并在以后提交该文件以供识别。我只是想知道,是否有可能存储和检索指纹,而不是记录) 我们非常感谢你的帮助。 问候和感谢。沃利
浏览 5
提问于2017-02-19
得票数 1
回答已采纳
1
回答
eesen-转录器-向字典中添加技术词汇
、
、
我正在使用存储库转录一些音频文件,并且我已经在我的Vagrant虚拟机上按预期启动并运行了所有内容。 我希望能够用Linux、Laravel或MySQL这样的词来转录非常技术性的录音,这些词不能很好地转录。我该如何(轻松地)将这些单词添加到转录软件中,以便在说出这些单词时成功识别它们? 更新 我试着遵循尼古拉·什米列夫给我的建议,在这里找到: 在将新的单词添加到newwords.txt之后,我可以成功地运行run_adapt.sh脚本,但是当我尝试使用更新后的语言模型用新的单词转录音频文件时,它无法识别新的单词。 以下是我尝试遵循有关如何调整语言模型的说明的视频:
浏览 1
提问于2016-11-30
得票数 0
1
回答
表中按年、月、周选择数据
、
我有以下表格: Table: promotion_asset promotion_id asset_id (促销可以有许多资产) Table: promotion_tracking id(PK) asset_id date_scanned (每次扫描资产时的记录表) 我想在一个查询中尝试能够识别特定促销ID中的资产被扫描的次数:今年、本月和本周。 我尝试了许多不同的方法,但无法找到一个返回正确结果的查询。
浏览 0
提问于2011-11-09
得票数 1
1
回答
在IBM语音识别服务中,有没有一种方法可以发送文件的URL而不是文件本身
、
在IBM语音识别服务中有没有办法 发送文件的URL,而不是发送文件本身。这对我来说很重要,因为我想要发送转录的录音并不存储在运行代码的相同位置。我正在使用IBM Java SDK。
浏览 1
提问于2016-09-21
得票数 0
2
回答
一种有效的录音质量检测方法
、
、
我们有来自我们的服务器端进程之一的实时、不加控制的记录的各种波形文件,而且它们中的大多数在整个过程中都有很好的清晰的语音。然而,有时他们是混乱的,他们有静态,或说话音量不够大。是否有一个有效的方法来确定一个记录是否被认为是“良好”质量使用C#? 我曾想过要把已知的好唱片的平面图和不好的录音进行比较,但是每次录音都会有不同的语言,所以这可能行不通。我研究过像Bass.Net和NAudio这样的库,但是音频处理不是我的专业领域。 我可以尝试比较,但我不完全确定它是如何工作的。我看到有人试图用他们的音频指纹哈希和Levenshtein距离算法来比较两个音频文件,以找到两个音频文件之间的相似度。除非音
浏览 6
提问于2013-08-14
得票数 0
回答已采纳
4
回答
比较两个音频文件
、
、
、
我想建立一种“语音识别”系统。 其目标是比较一个新的录音与原始音频文件,如果声音是> x%相似,做一些事情。 已经有类似的工具了吗?
浏览 0
提问于2016-01-27
得票数 4
1
回答
iOS语音识别-非文字识别,由其他记录识别
、
、
、
对于语音识别,我知道有几个问题,但我有一个不同的问题。我的客户想通过另一个录音(先前保存的)进行识别。假设用户保存了录音,他说:“语音命令”,然后当他触摸某个麦克风图标在应用程序,它将开始监听,然后它将比较之前的录音,如果是相同的命令或不。我试图改变客户的想法,并使用一些演讲文本库/项目,但他想这样做。 所以我问你能不能给我看一些免费的/开放的图书馆?
浏览 1
提问于2014-04-23
得票数 3
回答已采纳
1
回答
基于点击事件android的音频录制和保存
、
我想要创建的应用程序,当我点击按钮,录音应该在特定的时间(5s),然后我可以保存到应用程序的文件夹或在我的手机或使用文件直接在接下来的步骤。具体来说,我将在5秒内录制一个音频文件,然后通过我的单词识别算法开始识别,并执行以下命令。请在记录和保存文件的过程中帮助我。谢谢你们的阅读。
浏览 3
提问于2021-10-28
得票数 0
回答已采纳
1
回答
Windows Vista语音识别引擎采样率
、
、
、
我需要从一组WAV文件中识别语音,这些文件没有记录在进行识别的计算机上。我知道,如果您识别WAV文件中的语音,并且这些WAV文件的采样率与引擎用于训练的录音的采样率相同,则效果会更好。 但我的问题是:Vista的引擎训练的采样率是多少?我似乎在任何地方都找不到这个信息。 还有..。你知道什么方法可以将WAV文件从一种采样率转换到另一种采样率,从C#? 谢谢!
浏览 2
提问于2010-06-30
得票数 0
回答已采纳
1
回答
在Java中比较两个声音(带容差)
、
、
、
我正在寻找一种相对简单的方法(可能是一些示例或具有良好API的库?)用Java比较两个声音(当然要有容差)。其来源是一些带有手拍声的声音文件。我想要比较的声音是通过麦克风进行的现场录音。麦克风每次识别出更响亮的声音时都会开始3秒的录音,并将其与源文件进行比较。 目的:我正在运行一个带麦克风的Raspberry Pi,如果我拍手,我想要切换我公寓里的灯。
浏览 0
提问于2013-11-30
得票数 3
2
回答
将Python语音识别音频帧数据转换为可以由Whisper处理的numpy数组?
、
、
、
我正在使用语音识别Python库以16 the的单数从我的麦克风记录音频字节,但我想使用接受NumPy数组、光谱图和文件路径的新的Whisper库。写入文件花费的时间太长,所以我想直接将数据转换为数组,将其传递给Whisper。
浏览 16
提问于2022-10-07
得票数 0
0
回答
如何在android中播放.opus音频文件?
、
、
、
、
我正在开发一个应用程序识别语音使用谷歌云语音APi和录音的同时。我尝试播放录制的.opus音频文件获取IOException W/System.err: java.io.IOException: setDataSource failed. 有什么想法吗?谢谢!!
浏览 20
提问于2017-06-08
得票数 5
1
回答
我应该使用什么Wav格式来记录音频和识别其中的语音?
我正在创建一个windows服务,它将连接到音频输入设备,并使用NAudio WaveIn记录音频。这就是流动: 使用VOSK语音识别的第一级语音检测,并将录制的音频添加到内存流中。如果识别了语音,则将内存流保存到wav文件中。第二级语音识别使用Microsoft认知语音服务从wav文件中读取。 我的问题是,在保存wav文件时,我应该使用什么样的波形格式来临时提高认知语音服务的语音识别精度。 _waveIn.WaveFormat =新WaveFormat(8000,16,1); 或 _waveIn.WaveFormat =新WaveFormat(16000,16,1); 任何帮助都将不胜感激。
浏览 15
提问于2022-02-16
得票数 0
1
回答
录制语音JS并发送到服务器
、
我正在为我在大学的考试工作,我需要帮助。我想要实现语音记录到web浏览器,以记录语音,然后发送它的服务器进行语音识别。我已经找到了这个录音JS,它可以记录声音,然后下载到PC作为.wav文件。我想修改这个录音机把这个wav文件不是发送到PC,而是发送到服务器。你能帮我弄一下这个吗??此外,我还需要解释这个JS的源代码,因为我在JS中处于新的位置。多谢各位。 我要修改的记录器的源代码是:。
浏览 14
提问于2015-02-04
得票数 1
1
回答
根据算法将音频与目标对齐
、
我有很多不同的音频片段是由Android手机录制的,我也有一个用高端麦克风和Apple Logic录制的同一活动的音频片段。 我想录制一段在Apple Logic录音和电话录音之间来回切换的录音。我最初只是把录音在起始点对齐,但我注意到,安卓手机的录音会随机跳过10到100个样本,这是我不明白的原因( I/O代码似乎是正确的,并且在所有设备上产生相同大小的文件,所以我猜AudioRecorder正在删除样本)。 所以我的问题是--有没有人们知道的工具或算法,可以帮助运行批处理作业来识别音频延迟的位置(超过某个阈值),并插入静默,从而使事情保持一致?我已经实现了一个粗糙的RMS分析器,它试图在记
浏览 3
提问于2017-09-16
得票数 0
1
回答
将话筒录音转换为Windows 8中的字符串
、
、
、
背景信息我正在尝试将麦克风录音转换成字符串。 到目前为止,我一直跟随这个例子从MSDN网站创建一个程序,让我用麦克风录音,并播放它。下面是链接。 遗憾的是,我还没有找到任何办法把录音转换成弦乐。 问题如何将麦克风录音转换为字符串? 我尝试过使用语音识别引擎,但不幸的是,名称空间System.Speech不能在Windows 8 sdk中使用。
浏览 0
提问于2015-01-12
得票数 0
1
回答
Microsoft Oxfordproject语音到文本的Rest
、
、
、
我需要通过Rest与微软引擎识别语音到文本(我知道其他的语音到文本引擎,而且我让它们工作,但现在我需要的正是MS语音到文本)。 我看了很多信息和手册,但都没能用。 我试着遵循MS站点的手册(对不起,我不能添加更多的链接),但没有运气,然后我找到了许多“有用”的例子,并找到了另一种方法通过MS API识别,但与问题堆叠: 1)我可以获得授权承认请求的令牌: 2)在我有了标记之后,我可以尝试请求识别该录音: 但无论如何,我会得到错误的。尽管在请求中设置了“版本”。 如果有人知道如何通过Microsoft服务识别录音,请给我举个例子。
浏览 3
提问于2016-02-29
得票数 1
回答已采纳
1
回答
语音识别抛出未知值错误
、
我是python语音识别的新手,每当我试图使用google转录音频文件时,我就会得到一个未知的值错误。 我试过在网上搜索这个问题,但是找不到解决这个问题的方法。 完整的代码和错误都放在hastebin:上。 显然,预期的输出应该是文件中的文本。
浏览 0
提问于2019-04-08
得票数 0
1
回答
我希望FFmpeg在检测到低于阈值的静音时,停止录制麦克风。
、
、
、
、
我试着做一个实时的演讲到文字抄写脚本。下面的脚本适用于录制的wav文件。 from asrecognition import ASREngine asr = ASREngine("tr", model_path="mpoyraz/wav2vec2-xls-r-300m-cv6-turkish") audio_paths = ["prerecorded.wav"] transcriptions = asr.transcribe(audio_paths) print(transcriptions) 但是我想用麦克风捕捉声音,当检测到一段时间
浏览 0
提问于2022-10-11
得票数 1
1
回答
使用JACK & Guitarix录制低音吉他时的延迟
、
我最近开始使用Ubuntu将我的个人电脑转换成基本的家庭录音棚。令我惊讶的是,Rocksmith USB电缆被直接识别并顺利运行,对像我这样的新手来说,配置JACK有点困难,但我终于做到了。我也安装了奥迪,以便我可以录制的声音,并有我的问题开始。在我播放的MP3文件和低音吉他的录音之间有一个严重的延迟。虽然播放一切听起来都很好,但是一旦录制好,MP3文件和我录制的文件之间就会出现一些问题。有人也有同样的问题吗?有什么解决办法让时机变得尽可能完美吗? 提前谢谢。
浏览 0
提问于2015-09-21
得票数 0
3
回答
安卓:同时访问麦克风(RecognizerIntent +自己的应用程序)
、
我的应用程序使用RecognizerIntent记录用户的声音,并做一些语音识别。 现在,我想将结果与一些开源语音识别引擎进行比较。它们中的大多数都以音频文件作为输入。我的想法是,从安卓的麦克风捕捉声音,同时启动RecognizerIntent。但似乎,访问麦克风是排他的。 可以用录音的音频流使用RecognizerIntent吗?可以用两个激活同时访问麦克风吗?
浏览 7
提问于2011-01-12
得票数 11
回答已采纳
1
回答
优图能否实现识别一张图片和某一张图片是否是一样的?
优图能否实现识别一张图片和某一张图片是否是一样的? 我要做的功能就是,拍照上传图片识别对应我的一段文字讲解录音。
浏览 350
提问于2019-04-10
2
回答
使用Accurev自定义签入策略
、
、
我正在使用AccuRev pre-promote触发器实现自定义的促销策略检查。如果促销是从工作区升级到流,则AccuRev会提供触发器参数文件。我能够成功地访问此文件,并且该策略可以很好地用于workspace来流式传输促销。我正在寻找一种类似的流到流促销策略(例如,挂钩到可以给我提供信息的东西,比如正在推广问题的用户,正在推广的问题列表,或者源/目标流),但到目前为止还没有成功。 AccuRev提供的数据是否类似于流到流促销的触发器参数文件? 如果不是,有什么建议可以帮助你解决这个问题吗?
浏览 3
提问于2013-08-27
得票数 0
1
回答
一句话识别返回的为什么不对?
、
、
我录音是“窗前明月光 低头思故乡 举头望明月 低头思故乡”,只返回了 “窗前明月光 低头思故乡 ” 请问是我哪里写的不对吗? 1. 录音地址: http://mx-image.tiaozj.com/443e2f1412e7f832a54aec08e0301173 2. 语音识别参数 let param = { Action: 'SentenceRecognition', Version: '2018-05-22', ProjectId: '0', //腾讯云项目ID SubServiceType: 2, //一句话识别,没得选
浏览 284
提问于2019-06-25
1
回答
Android -启动呼叫时释放资源
、
、
在我的应用程序中,我使用录音和麦克风来录制任何东西,但我需要在来电和呼出时释放它。 对于传入,我使用了BroadcastReceiver类,但是对于传出? 我不能在我的应用程序的onPause或其他方法中发布,因为录音在服务中(后台)。 我需要识别用户何时开始呼叫。
浏览 0
提问于2014-01-03
得票数 0
1
回答
Android比较两个声音进行语音匹配
、
如何在android/Java中比较两个语音进行语音匹配?它基本上类似于语音识别/文本到语音转换,但语音识别不适用于我的语言。我的应用程序看起来像这样:我在数据库中保存了10个人,对于每个人,我会录制不同的声音(语音)并保存它。然后按一下按钮,我就会录制另一个声音,并将其暂时保存。现在,我如何将此录音与我的10个人的声音录音进行比较,并与一个人进行匹配?
浏览 1
提问于2012-11-29
得票数 6
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
录音文件转文字 录音文件转文字教程
录音转文字识别怎么用?分享三个录音转文字识别软件给你
AI技术实践|用腾讯云录音文件识别让无字幕视频自动生成字幕
录音识别成文字的软件 录音识别成文字的软件教程
多功能录音识别黑科技
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券