腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
WebRTC允许创建
音频
、视频和文本聊天吗?
、
我想创建
音频
,视频和
文字
信息聊天。可以使用WebRTC吗?或者它只允许
音频
和视频聊天? 我的应用程序的一个方面将使用浏览器实现。另一种是使用C++原生
API
。有没有原生C++
API
和/或javascript的例子?
浏览 2
提问于2012-10-15
得票数 1
回答已采纳
2
回答
tts文本转语音出现
音频
最后停顿声音,请问如何解决?
、
、
、
、
tts文本转语音出现
音频
最后停顿声音,请问如何解决?
音频
如下: tencentAi_1.zip
浏览 1262
提问于2019-04-29
1
回答
如何在Iphone中保存带有
音频
和照片的笔记
、
我搜索了Evernote
API
的this.but,它不工作,有没有办法保存
文字
注释,
音频
和照片的单一文件单位?喜欢这个应用程序
浏览 0
提问于2011-05-26
得票数 0
回答已采纳
1
回答
语音到文本
音频
限制请求
本公司使用语音
文字
API
制作可搜索的有声读物。我们的一些
音频
文件达到20小时,但正如我们注意到的,使用语音
文字
的基本限制是480分钟。 请让我知道,我们怎样才能要求把限制扩大到1200分钟?
浏览 14
提问于2022-03-05
得票数 -1
回答已采纳
1
回答
使用FFMPEG实现Webm到Flac
、
、
、
、
我正在录制来自HTML的
音频
,它被存储为.webm格式。我把这个
音频
输入到谷歌语音
api
中,以获取它的
文字
记录。我发现.flac是无损的,所以我使用FFMPEG将它从webm转换成了flac。但是我有一个疑问,将
音频
从webm转换到flac会增加文件的大小,但是如果一个
音频
已经与webm格式有损耗,转换为flac将仍然是有损的,因为信息已经丢失了。这个假设我错了吗?
浏览 4
提问于2020-07-20
得票数 1
回答已采纳
1
回答
Google-speech-
api
抛出EOF错误,而不是执行
音频
转录
、
、
、
、
在我的项目中,我在golang开发了一个websocket服务器,它通过ARI控制asterisk频道,并使用google-speech-
api
在同一频道上执行实时
音频
转录。在连接时,我想保存
音频
从一个星号频道到文件,同时发送
音频
到谷歌,并获得
文字
记录。
音频
是由asterisk audiofork应用程序发送的,这样我就可以使用ARI操纵频道,而
音频
则在另一个线程上流式传输。问题是,当我发送帧到谷歌,我得到EOF错误的第一个和每一个连续的帧,我从我的服务器上,但当我转换
浏览 73
提问于2021-10-07
得票数 0
回答已采纳
1
回答
Android底层
音频
接口
、
我正在寻找一些在安卓系统中播放内存中
音频
的方法,类似于Windows编程中的waveOutOpen家族方法。waveOut...方法本质上允许应用程序创建样本值的数组(就像没有头的内存中的WAV文件),并将它们
转
储到队列中以便顺序回放。Windows可以无缝地从一个数组转换到下一个数组,因此,只要应用程序在播放之前不断将数组
转
储到队列中,程序就可以创建和播放任意长度的连续
音频
。Windows
API
还结合了一个回调机制,应用程序可以使用该机制来指示进度和加载额外的缓冲区。 据我所知,Android
浏览 1
提问于2010-08-09
得票数 10
回答已采纳
1
回答
用NAudio将pcm数据转换为wav文件
、
可以使用Wav
API
将原始NAudio文件转换为Wav格式吗?我可以看到有一个允许mp3
转
wav的Mp3FileReader,但我们需要转换原始
音频
数据文件。 谢谢
浏览 45
提问于2020-06-25
得票数 0
回答已采纳
2
回答
.NET:如何将mp3或wav文件转换为.flac
、
、
、
我需要在c#中编写一个实用程序,使用谷歌语音
Api
将语音从
音频
文件转换为文本。据我所知,谷歌只接受这个接口的.flac格式。不幸的是,我有.wav和.mp3
音频
文件。所以我试着找出是否有办法在.NET中将mp3
转
换为flac。我查看了NAudio,但它似乎不能处理flac文件。
浏览 0
提问于2013-07-14
得票数 6
回答已采纳
1
回答
使用.mp4将立体声MediaComposition文件转换为16 WAV的单WAV
音频
、
、
我正在尝试使用媒体组合和Windows.Media.Transcoding
API
自动将一些.mp4文件中的
音频
轨道转换为16 the的单PCM
音频
,以便使用Microsoft语音认知服务(语音到文本)我有一个带有正确MEdiaEncodingProfile的示例
音频
文件,我使用MediaEncodingProfile.CreateFromFileAsync(sampleAudio)。但这会导致prepareOp.CanTranscode = false,因为我认为我不能直接将.mp4
转
换成
音频<
浏览 1
提问于2018-05-13
得票数 0
回答已采纳
2
回答
音频
播放开始时不开始
、
、
当我运行一个
音频
文件,如mpg321或aplay或sox,甚至在TTS的(文本发言)
音频
只有正确输出从我第二次复制
音频
文件.我猜是因为
音频
引擎或类似的东西延迟了0.5到2秒。然后跳过一秒或两秒钟的
音频
。如果我运行
浏览 0
提问于2015-02-13
得票数 2
回答已采纳
1
回答
如何在android中使用USB吉他接口实时处理
音频
?
、
、
我想学习如何在Android中实时处理
音频
输入,所以我想做一个实验性的应用程序,对连接到Android设备上的吉他进行简单的
音频
操作,实现一个简单的超速效果。USB吉他接口,如,以实现一个非常低的延迟
音频
处理。因此,我想在我的项目中使用这个usb吉他
音频
接口来实现低延迟。我搜索了使用这种吉他接口的示例,但没有找到任何使用它的教程或库,所以…… 当连接到设备时,这个吉他
转
USB接口可以像普通输入一样使用吗(这样我就可以像在普通输入中一样使用AudioRecord类)?您是否知道是否存在一些文档或教程来使用这
浏览 1
提问于2015-10-29
得票数 1
1
回答
getBestScore()和getProb()方法获得0
、
我正在使用pocketsphinx android开发一个应用程序。使用关键字搜索激活。激活效果不太好,许多假阳性,也不总是认识到我说的。因此,我决定使用getProb方法来查看检测单词的概率,但是getBestScore()和getProb()方法总是返回0,原因是什么?
浏览 26
提问于2015-09-27
得票数 2
回答已采纳
1
回答
谷歌语音到文本是如何工作的?
、
、
、
我想知道,谷歌如何在他们的语音识别
API
中将语音转换为文本。它们是否存储了几乎所有的声音并在特定的频率水平上进行匹配,或者是否有不同的
音频
编解码算法来分析"A“、"B”、"V“、"D”、"Hello“等不同声音模式的声音。音乐有弹吉他,鼓和声音的声音,我想过滤他们在三个输出分别吉他声音,鼓音,声音分开,并进一步解码声音为
文字
。
浏览 3
提问于2016-06-12
得票数 3
回答已采纳
1
回答
如何通过发送到认知服务来防止数据的保留或重复使用?
在这一点上,不会记录任何
音频
或转录”。 在部署speech
API
时,我一直在寻找该选项,但没有成功。你到底是如何关闭跟踪的?通过这样做,是否是这样的情况下,没有
音频
或
文字
记录被保留,或进一步处理或发送到任何地方,作为调用speech
API
的结果,无论是作为FAQ中引用的日志的一部分,还是用于任何其他目的或任何其他方法?
浏览 12
提问于2019-06-26
得票数 0
回答已采纳
5
回答
Google函数和AWS的超时问题
、
、
、
、
我们正在使用NodeJS处理长的
文字
记录,使用Google语音到文本
API
。许多功能需要10分钟以上的时间来处理。处理/
音频
时间的通常比率约为50%。因此,一个20分钟的FLAC
音频
文件大约需要10分钟来处理(因此,Google功能失败,最大时间为540秒或9分钟),而在AWS Lambda上超过29分钟的任何文件都会失败。在每个平台上,哪种服务可以在20/30分钟内处理
音频
文件,这也允许发送和调用应用程序的事件数据?我可以使用云功能和另一个平台来处理记录吗?
浏览 6
提问于2019-08-27
得票数 8
回答已采纳
1
回答
如何确定对话流源是文本还是
音频
?
、
我想区别我的机器人的Alexa和谷歌主页的经验与
文字
为基础的机器人。基于文本的机器人支持富响应类型,但
音频
响应类型不支持。我的问题是,在对话框流V2beta1
API
文档中找不到指定
音频
文本源的字段。在V1中,似乎有一个使用一个数字枚举来表示这一点,但我找不到一个V2Beta1等效项。
浏览 1
提问于2018-05-03
得票数 0
回答已采纳
1
回答
用来聊天的协议是什么?webRTC或Websockets
、
、
我正在创建一个聊天网站,将能够做到,视频,
音频
和
文字
聊天。我目前正在使用Websockets进行文本聊天。我需要知道什么是最好的视频,
音频
和
文字
聊天。哪一个更有效果。我应该使用Websockets对他们所有的,或webRTC的视频和
音频
和Websockets的
文字
聊天。我可以做到这两个,并且不想重写我的文本聊天为webRTC,但如果这是一个更好的选择,那么我会。
浏览 0
提问于2013-03-29
得票数 5
回答已采纳
1
回答
如何给予谷歌存储桶权限谷歌语音文本
API
?
、
我已经创建了谷歌存储桶,以执行谷歌语音到
文字
桶中的
音频
文件。但这是不起作用的,因为桶是拒绝访问谷歌语音
API
。错误消息:匿名调用方没有storage.objects.get access PERMISSION_DENIED 语音使用
API
密钥进行身份验证,存储使用服务帐户密钥进行身份验证。
浏览 2
提问于2019-07-08
得票数 0
回答已采纳
1
回答
如何枚举Windows 8上的媒体基础转换
、
、
在我的Windows应用程序中,我想使用
音频
文件进行重采样。似乎,解决这个问题的好办法是使用来自媒体基金会的Resampler对象进行转换。但是,在认证时,我得到了这样的错误:此应用程序类型不支持
API
MFTEnumEx in mfplat.dll。。在Windows 8
转
换中是否有其他方法可以获得avaiable,或者重采样
音频
文件的另一种方式? 谢谢!
浏览 2
提问于2012-12-21
得票数 0
点击加载更多
相关
资讯
文字转拼音免费API接口教程
音频文件转文字怎么转?音频文件转文字软件有哪些
音频转文字怎么操作?1分钟告诉你音频转文字电脑版怎么转!
想知道音频转文字怎么转?分享两个mp3音频转文字的方法
视频音频转文字怎么转?安利一个给力的文字提取工具!
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券