腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(2738)
视频
沙龙
1
回答
我们可以在MATLAB中使用Microsoft Speech
API
的
语音
转
文本
功能吗?
、
、
我们可以在MATLAB中使用Microsoft Speech
API
的
语音
转
文本
功能吗?这是
文本
转
speech.How的代码,我们可以使用它的功能是
语音
转
文本
吗?
浏览 1
提问于2013-02-26
得票数 1
1
回答
Microsoft
语音
产品/平台之间的差异
、
、
、
、
微软似乎提供了相当多的
语音
识别产品,我想知道它们之间的区别。 然后是 (或桌面SAPI)、 (或Server )和。但我猜想它们是基于HMM的旧的
语音
识别模型,也不是
神经网络
模型,这三种模型都可以脱机使用,不需要互联网连接,对吗?对于
浏览 3
提问于2018-06-12
得票数 10
回答已采纳
1
回答
微软的深层
神经网络
模型包含什么样的语言?
我是调查微软翻译
文本
API
。我了解到它有两种类型的翻译器模型,更新的深层
神经网络
模型DNN和传统的统计机器翻译( SMT )。我还找到了下面的说明, Microsoft Translator supports 60 languages for text translation through the Microsoft Translator
API
浏览 2
提问于2017-11-13
得票数 0
回答已采纳
1
回答
Kaldi是否返回任何识别可信度参数,类似于Google
语音
到
文本
API
?
、
、
、
、
我在处理一项
语音
识别任务。到目前为止,我一直在使用Google
语音
识别
API
(在Python中),取得了很好的效果。
API
返回一个以及转录的
文本
的每一个块。如文档中所述,置信度是介于0到1之间的一个数字,但对于Google的
API
是如何导出这个数字的,我没有找到更深层次的解释,所以我假设它来自于进行识别的
神经网络
。下一步我想要做的是制作我自己的(离线)自动
语音
识别程序,我发现应该可以胜任这项任务。我还没有开始对它进行编程,但我想事先知道(为了研究目的
浏览 4
提问于2019-10-15
得票数 3
回答已采纳
2
回答
.NET:如何将mp3或wav文件转换为.flac
、
、
、
我需要在c#中编写一个实用程序,使用谷歌
语音
Api
将
语音
从音频文件转换为
文本
。据我所知,谷歌只接受这个接口的.flac格式。不幸的是,我有.wav和.mp3音频文件。所以我试着找出是否有办法在.NET中将mp3
转
换为flac。我查看了NAudio,但它似乎不能处理flac文件。
浏览 0
提问于2013-07-14
得票数 6
回答已采纳
1
回答
在瀑布对话中有接受声音输入的方法吗?
、
、
、
我目前正在创建一个聊天机器人,它必须接受用户的
语音
输入。但是,使用瀑布对话框提示用户输入不包含接受
语音
的提示。我正在使用Azure
语音
服务来进行
语音
识别,我想知道是否有办法做到这一点。我尝试将
语音
识别结果转换为字符串,并将其作为用户
文本
输入发送,但我对编码还不熟悉,而且感觉自己做错了。这是瀑布对话框步骤的一部分。
浏览 1
提问于2019-05-17
得票数 1
回答已采纳
2
回答
如何对
神经网络
进行训练,生成串联的特征向量?
、
传统的
神经网络
采用固定大小的并行输入神经元和固定大小的并行输出神经元。 一个序列化的实现可以用于
语音
识别,其中我可以给网络提供一个时间序列的波形,并在输出端获取音素。
浏览 0
提问于2013-10-17
得票数 3
回答已采纳
1
回答
基于有限字典的Android
语音
控制
、
、
我真的很感激对android的
语音
控制帮助很小。我正在制作声音控制的国际象棋,但
语音
识别是识别我不想要的单词。
浏览 10
提问于2022-08-09
得票数 0
1
回答
云点播上传视频后转码怎么调用?
、
js上传视频后,转码接口怎么调用
浏览 520
提问于2020-03-19
1
回答
LSTM和Seq2Seq (M到1)的区别是什么
、
、
我想问的是,LSTM可以建模为多对一。但是,Seq2Seq也可以建模为多对一。(当N为1时,M到N)。那么,有什么不同呢?
浏览 5
提问于2021-03-23
得票数 2
1
回答
基于embeddedTTS的安卓系统离线
语音
识别
、
我有兴趣看看离线
语音
识别是否可能使用Android上的谷歌TTS,并试图做到这一点,但没有成功。当我连接到网络时,
语音
识别工作得很好,但我需要让它离线工作。它返回了两个特性:用于谷歌
文本
语音
转换引擎的embeddedTts和networkTts,因此embeddedTts特性是可用的。
浏览 4
提问于2013-02-14
得票数 1
2
回答
python中的
语音
到
文本
、
、
假设我想用印地语或任何其他语言输入声音,它会给出英语(
文本
).How的输出,我能这样做吗?我知道的是:我知道如何把声音转换成文字。例如:信息提供: language=hindi输入: kese (
语音
)输出:你好吗?(案文)
浏览 24
提问于2022-10-15
得票数 -1
1
回答
语音
输入导航
、
、
我被要求制作一个
语音
输入符号到一个站点页面,通过一个人的声音获得订单,并执行命令,例如,想象有人说登陆页面,然后它探索到登陆页面。 我不知道该怎么做,我需要你的帮助。
浏览 9
提问于2022-12-03
得票数 0
回答已采纳
1
回答
Xamarin android应用程序中的SpeechRecognitionEngine
、
、
、
Xamarin android框架中包含的内容是相同的吗?
浏览 0
提问于2021-08-03
得票数 1
1
回答
使用librosa将
语音
A转换为
语音
B
、
、
、
、
我是librosa和voice/sound分析的新手。我已经在SO和google上搜索了这个直接的问题,但没有得到一个可以理解的答案。 假设有两个声音A和B。我想要将voice A转换为voice B。 考虑到这两种声音,有没有可能在A上做一些听起来像B的事情?
浏览 46
提问于2020-11-27
得票数 0
回答已采纳
1
回答
Ruby中有哪些
文本
到
语音
库可供使用?
、
、
Ruby中有哪些
文本
到
语音
库可供使用?我正在寻找带有显式Ruby的库,并且不想处理JSON、XML或系统调用。
浏览 0
提问于2019-03-10
得票数 0
1
回答
Tensorflow/Deep Learning能否用于梯度增强树、Logistic回归?
、
、
Tensorflow和深度学习主要用于图像处理(分类、识别)、NLP、
语音
和
文本
处理。我以前用过Spark MLLIB和Mahout吗?Tensorflow有深度
神经网络
的例子-- 。
浏览 8
提问于2017-08-04
得票数 0
1
回答
颤振::我可以用
语音
来文字
api
而不用发音校正吗?
、
、
我正在制作一个应用程序,使用给
api
发短信。由于使用,我觉得这个
api
没有将确切的发音转换为
文本
,而是纠正了发音并将其转换为
文本
。 例如,如果我发音'opple',
文本
将自动转换为'apple‘。有没有任何方法可以使用
语音
到
文本
api
,没有一个功能,以纠正发音?
浏览 2
提问于2021-09-15
得票数 0
回答已采纳
1
回答
从理论上讲,日常计算任务能被分解成可以用
神经网络
求解的任务吗?
麻省理工学院评论最近发表了一篇关于IBM芯片的文章,它或多或少是一种人工
神经网络
。 这篇文章指出,芯片可能已经从未来借来了一页。这可能是一个新的、不断进化的计算能力时代的开始。这就引出了一个问题,日常计算任务能被分解成可以被
神经网络
解决的任务吗(理论上和/或实践上)?
浏览 2
提问于2014-08-08
得票数 3
2
回答
TTS BlackBerry接口
、
在BlackBerry中有没有使用TTS (
文本
到
语音
)的
API
?这可以在任何版本的操作系统上运行。
浏览 2
提问于2011-12-19
得票数 1
回答已采纳
点击加载更多
相关
资讯
文本转语音怎么转?中文文本转语音软件有哪些?
用 OpenAI API 实现文本转语音:OpenAI TTS 代码深入解读
语音转文本,轻松教你把语音转文本
OpenAI推出ChatGPT API供第三方使用,公布语音转文本模型
免费文本转语音在线有哪些?推荐这些文本转语音软件给你
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券