腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(6343)
视频
沙龙
0
回答
如何
从
扬声器
输出
将
语音
实时
转
换为
文本
我正在尝试
从
麦克风和
扬声器
输出
的
语音
的
实时
转换。目前,我正在尝试
将
两个
扬声器
的通话记录到一个wav文件中,并将其发送到Cognitive SDK进行转换。有没有办法使用认知sdk转换
扬声器
设备的
输出
。链接到任何样本都会很有帮助。
浏览 4
提问于2018-07-15
得票数 0
1
回答
将
扬声器
注释(例如id,name)添加到云
语音
到
文本
api中,并将其包含在云
语音
到
文本
api生成的
输出
json中。
Google云平台的云
语音
到
文本
api
将
多个
扬声器
音频转
换为
文本
。它返回一个JSON
输出
,其中包括谁在什么时候说了什么。但说话人识别(WHO)是匿名的。是否有一种方法来注释或给出有关
扬声器
的输入(例如id、name),并将其包含在api生成的
输出
JSON中?
浏览 1
提问于2021-01-12
得票数 0
1
回答
如何
在python中接收音频输入并将其转
换为
文本
字符串
、
、
、
我想我的问题
从
标题上说得很清楚例如,如果我使用麦克风并说“你好”,python程序
将
返回" Hellow“作为
文本
值。
浏览 4
提问于2017-05-26
得票数 0
回答已采纳
2
回答
语音
到文字Java应用程序的
实时
字幕可能吗?
、
、
这是
将
Google
语音
转
换为
文本
API: 能
浏览 11
提问于2022-04-12
得票数 -4
回答已采纳
1
回答
将
音频流保存到mp3文件(iOS)
、
、
、
、
我有一个
将
文本
转
换为
语音
的AVSpeechSynthesizer,但是我遇到了一个问题。 我不知道
如何
将它生成的音频文件保存到音乐文件中,这是我非常希望能够做到的!因此,我的问题是,
如何
保存AVSpeechSynthesizer
输出
,如果这是不可能的,我可以使用AVFoundation、CoreMedia或其他公共API来捕获
扬声器
的
输出
,但在它发布之前?
浏览 0
提问于2013-09-25
得票数 5
回答已采纳
1
回答
VOX文件到
文本
,这有可能吗?
、
目前,
语音
脚本以.VOX格式存在--而且.它们不是“写出来的”/文档。是的,有大量的应用程序/程序可以
实时
地对
文本
进行
语音
处理,但我希望能够
将
录音“上传/
转
储”到程序中,并获取
文本
。
浏览 1
提问于2014-05-19
得票数 1
回答已采纳
1
回答
Azure转录JSON文件的VTT
输出
、
我抬头发现了这个- 我计划编写一个脚本,
将
转录的JSON转
换为
VTT,但是如果已经有了,或者我可以请求作为
输出
格式的东西,这将是非常有帮助的
浏览 9
提问于2022-11-10
得票数 0
1
回答
说话人识别vs说话人识别google cloud vs microsoft azure vs ibm watson vs aws转录
、
、
、
、
我想做一个
语音
到
文本
分析的项目,我想要1)说话人识别,2)说话人二元化,3)
语音
到
文本
。在
扬声器
二元化中,如果我理解正确,它将能够“区分”用户,但它
如何
识别,除非我不注册他们?
浏览 0
提问于2020-01-20
得票数 0
1
回答
在Google
语音
文本
中添加转录本以提高识别能力。
、
、
、
、
为了让他们不了解布道,我制作了一个应用程序,
实时
发送翻译到电报。这是很好的,但识别往往不够准确。在Google中,是否可以添加带有转录的音频文件,以便能够了解说话人的
输出
?我们总是同一个说话者,所以如果我能让谷歌‘了解’
扬声器
,我认为准确性可以更高。或者有人有另外的想法
如何
提高准确性?我确实尝试了
语音
适应性增强(),但这并没有多大帮助。
浏览 10
提问于2022-05-16
得票数 4
1
回答
从
webRTC到
文本
实时
翻译Twilio音频流?
、
、
、
、
我需要从电话号码获取twilio voip音频信号,并在不断开呼叫的情况下
实时
将
音频转
换为
文本
,以便采取特定的操作。1.调用
语音
-> 2.转
换为
文本
#
实时
-> 3.检测
语音
端-> 4.获取最终字符串我调查了translator.js,有什么建议吗?
浏览 20
提问于2016-08-22
得票数 1
1
回答
iOS上麦克风输入的
语音
活动检测
、
、
、
、
我正在开发一个iOS应用程序,它执行基于
语音
的人工智能;也就是说,它的目的是
从
麦克风获取
语音
输入,将其转
换为
文本
,发送给AI代理,然后通过
扬声器
输出
返回的
文本
。我已经做好了所有的工作,只是使用一个按钮来开始和停止录制
语音
(SpeechKit用于
语音
识别,API.AI用于AI,亚马逊的Polly用于
输出
)。这个应用程序是在一个非正统的环境下开发的,用户
将
无法访问屏幕(但他们将有一个高
浏览 51
提问于2017-08-06
得票数 9
1
回答
Android
语音
文本
查询
、
在
语音
输入是
如何
工作的背景下,
语音
输入
将
流到服务器上,服务器上的
语音
将被转
换为
文本
,最后
文本
将被发送回我们的应用程序。但我的问题是 是否有可能,我们可以得到
实时
的
文本
,就像如果用户说你好,然后应用程序
将
立即得到你好。我已经检查过了,我们可以在onActivityResult中得到
文本
。你能告诉我,我们是否有可能
实时
收到短信,而不是在停止讲话之后。
浏览 0
提问于2019-02-05
得票数 1
1
回答
将
文本
转
换为
语音
- TTS设置为振铃器音量
、
、
如何
控制TTS音量?我不想使用AudioManager,因为audiomanager无法通过按下Galaxy选项卡上的音量按钮进行设置(我认为这是振铃器音量)。那么,
如何
将
TTS
扬声器
更改为振铃器音量?谢谢。
浏览 2
提问于2012-04-09
得票数 0
回答已采纳
1
回答
如何
使用谷歌翻译/谷歌云获取印地语
语音
、
、
、
我觉得奇怪的是google cloud text to speech不提供印地语, 1)为什么我们不能使用谷歌云访问印地语
语音
,而可以使用谷歌翻译? 2)
如何
解决让印地语
语音</em
浏览 9
提问于2019-01-07
得票数 3
0
回答
如何
将
Watson text to speech的
输出
路由/管道到本地
扬声器
vs终端
、
、
到目前为止,除了
将
声音
输出
到运行Node JS的Raspberry PI上的
扬声器
之外,我已经能够使一切正常工作。 我正在连接到
文本
到
语音
服务。我似乎
从
Watson服务得到了响应,但它显示在Pi终端上,而不是转到USB
扬声器
。在
文本
显示的末尾,它显示它正被发送到硬件设备0:0,这是错误的。所以我的问题是:是否有一个使用https:接口的参数,使您能够控制
将
语音
路由到哪个硬件声音设备,或者所有这些都必须在本地控制,在我
浏览 8
提问于2017-06-09
得票数 0
2
回答
.NET:
如何
将
mp3或wav文件转
换为
.flac
、
、
、
我需要在c#中编写一个实用程序,使用谷歌
语音
Api
将
语音
从
音频文件转
换为
文本
。据我所知,谷歌只接受这个接口的.flac格式。不幸的是,我有.wav和.mp3音频文件。所以我试着找出是否有办法在.NET中将mp3
转
换为
flac。我查看了NAudio,但它似乎不能处理flac文件。
浏览 0
提问于2013-07-14
得票数 6
回答已采纳
1
回答
iOS:静音右声道音量
、
我正在尝试
将
除我控制的音频流之外的所有音频的右声道设为静音。 我正在使用许多播放音频的库,包括用于
文本
到
语音
转换的OpenEars,我希望所有这些库都只播放左边的耳机
扬声器
,而播放右边的
扬声器
。我知道
如何
播放合适的
扬声器
,创建一个音频单元流,但是我没有为其他库创建音频流。有没有办法改变默认的音频通道?或者,有没有可能创建一个努力或混音器,应用于所有
输出
的音频,使正确的声道静音?
浏览 1
提问于2012-11-13
得票数 8
1
回答
C# -沃森-文字API演讲
、
、
、
、
我正在尝试在C# windows应用程序中创建一个windows应用程序,该应用程序应该使用IBM服务来执行
语音
到
文本
的转换。
如何
实现IBM
语音
到text服务,该服务应该倾听用户的声音并编写
输出
文本
。 我搜索了许多文章,在所有这些例子中,.wav (音频)文件被作为输入传递,
输出
文本
被写入。我试图执行这个演讲,以更
实时
地
文本
,而不是传递一个现有的或存储的音频(.wav)文件。以便应用程序能够识别
语音
浏览 4
提问于2017-06-15
得票数 0
8
回答
用于
语音
检测和识别的开放源代码
、
、
大部分内容似乎分为三类--按总长度、最长第一项排列顺序:沉默、
语音
广播和音乐。 我计划
将
所有磁带转换成数字格式,然后再查找录音。最明显的方法是在我做其他事情的时候,把它们都放进后台。
浏览 31
提问于2011-04-22
得票数 25
1
回答
在CMU sphnix4 1.0 beta6中使用语言模型
、
、
、
、
我是Java应用程序开发方面的新手,我正在尝试创建一个
将
语音
转
换为
文本
应用程序的示例,以便转换
实时
语音
。我试着使用Sphnix4-5prealpha,发现它与麦克风()有问题。我不确定helloNGram对我来说是正确的,即使这是正确的,我也不知道
如何
继续下去。我无法
从
helloNGram中找到任何前进的途径。有谁能帮我做两件事吗? 我应该
从
哪个例子开始?什么是高层次的步骤,以实现通用英语演讲对
文本
的应用,具有很
浏览 3
提问于2015-09-20
得票数 0
点击加载更多
相关
资讯
TTS语音播报模块是什么设备
用AI打个电话骗走22万欧元,克隆你的语音只需5秒录音
怎么把录音转换成文字,录音转换成文字的方法
科技:什么是文字转语音技术呢?怎么文字转语音呢?
pdf转word文档怎么转?教你3招轻松搞定
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券