腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(67)
视频
沙龙
1
回答
语音
识
别在
颤动
后
语音输入
部分
的
文本
正在进行
api
调用
、
、
、
稍后,当我收到
文本
时,它会将
文本
分成几
部分
发送。我使用
的
是speech_recognition插件,在这里我输入
语音
命令,
文本
被发送到一个创建
的
应用程序接口,但问题是它将
文本
分成几个
部分
发送到应用程序接口。示例:实际
文本
:现在是什么时间,但有时字符串会重复2次
API
调用
,或者有时它一次只发送几个单词 _speechRecognition.setAvailabilityHan
浏览 5
提问于2019-10-16
得票数 2
回答已采纳
2
回答
在Google应用程序上设置
语音
识别上下文?
、
、
我有一个Google应用程序,它使用Google客户端Javascript库上
的
操作:
语音
识别效果非常好。但有时我会遇到一种认知环境,它有一些小麻烦。有没有办法告诉
语音
识别设施,以强调在每个用户交互
的
基础上特定短语
的
概率?例如,如果用户被要求指定一个日期,那么一年中
的
几个月
的
概率就会超过正常值吗?在一些
语音
识别引擎中,您可以提供词汇表(也称为语法等等)。到引擎上。有没有办法用谷歌应用程序
的
动作来做到这一点呢?我知道谷歌
的<
浏览 2
提问于2017-10-13
得票数 2
3
回答
如何设置
语音
识别服务器?
、
、
、
如何在服务器端实现
语音
识别(请不要建议HTML5's x-webkit-speech,javascript等)?该程序将以一个音频文件作为输入,并以足够
的
准确性提供音频文件
的
文本
转录。我尝试过实现,但是它
的
准确性太差了(它们可能也是我
的
配置中
的
一些问题,我还在努力学习它)。任何现有的开源服务器如果能够以最小
的
错误率识别英语句子,也将是有用
的
。
浏览 6
提问于2012-01-18
得票数 1
回答已采纳
1
回答
如何在从其他活动返回到mainActivity
的
edittext中恢复之前输入
的
文本
?
、
、
我有一个包含两个活动
的
基本应用程序,如下图所示:The left screen is mainActivity, right screen is secondActivity 如果用户在第二个活动上按下我希望用户在第一个活动中输入
的
文本
(通过
语音输入
或直接作为
文本
)再次显示在可编辑
文本
字段中。,它将在返回到它时恢复,但我不会在我
的
mainActivity中
的
任何地方
调用
mainActivity ()。执行此操作
的
最
浏览 24
提问于2021-03-26
得票数 1
1
回答
SFSpeechURLRecognitionRequest只有在线程
调用
完成
后
才会输出
语音
识别结果
、
、
虽然我让它以初步
的
形式工作,但我遇到了一个奇怪
的
问题。在我
的
测试应用程序中,它似乎只在主线程终止
后
才输出
语音
识别结果(包括
部分
和完整)。请注意,如果我在print之前添加一个sleep(5),它将等待5秒,然后输出print,并且只有在主线程结束
后
才开始处理
文本
。我在GUI测试应用程序中看到过类似的行为,它只在启动请求
的
方法
调用
完成
后
才开始处理
文本
。 我尝试反复检查返回
的<
浏览 0
提问于2021-01-02
得票数 0
5
回答
Google函数和AWS
的
超时问题
、
、
、
、
我们正在使用NodeJS处理长
的
文字记录,使用Google
语音
到
文本
API
。许多功能需要10分钟以上
的
时间来处理。处理/音频时间
的
通常比率约为50%。因此,一个20分钟
的
FLAC音频文件大约需要10分钟来处理(因此,Google功能失败,最大时间为540秒或9分钟),而在AWS Lambda上超过29分钟
的
任何文件都会失败。在每个平台上,哪种服务可以在20/30分钟内处理音频文件,这也允许发送和
调用
应用程序
浏览 6
提问于2019-08-27
得票数 8
回答已采纳
3
回答
是否可以使用javascript来检测用户机器上是否正在运行屏幕阅读器?
、
、
、
我想要检测用户
的
机器上是否正在运行屏幕阅读器,以避免与html中
的
音频标签发生声音冲突。如果是,请详细说明如何做到这一点。
浏览 0
提问于2011-10-10
得票数 33
回答已采纳
4
回答
用于脚本WAV或MP3输出
的
文本
到
语音
(TTS)软件
、
、
希望我能在这里得到更多
的
观众。 我正在寻找一个低成本(或免费)
的
解决方案,如只有一个更好
的
引擎。也就是说,读入脚本并将字符分配给
语音
。我读过这篇文章
的
,但即使有了这些,我也必须连接wav文件。我正在考虑写我自己
的
,但我相信一定会有解决方案
的
。有什么建议吗?
浏览 2
提问于2012-04-07
得票数 8
回答已采纳
5
回答
Android
语音
识别与录音同时进行
、
、
我
的
应用程序使用AsyncTask中
的
MediaRecorder类录制音频,还使用Google
API
将
语音
转换为
文本
-识别器意图-使用这个问题中
的
代码: 我也尝试过在Thread中录制音频,但这是一个更糟糕
的
解决方案它会带来更多
的
问题。我
的
问题是我
的
应用程序在模拟器上工作正常。但由于缺乏
语音
识别服务,仿真器不支持
语音
识别。在我
的
设备上,当我开始录制音频和
浏览 0
提问于2011-08-23
得票数 24
1
回答
Jenkins pipeline -在C#中获取管道状态
、
有没有办法在代码中知道我启动了哪个构建,并使用一些rest
API
获得该构建
的
状态?
浏览 0
提问于2018-08-16
得票数 1
2
回答
语音
到文字Java应用程序
的
实时字幕可能吗?
、
、
这是将Google
语音
转换为
文本
API
: 活动标题保存在
文本
文件中,而新标题则继续在
文本
文件
浏览 11
提问于2022-04-12
得票数 -4
回答已采纳
4
回答
需要有关Ozeki (IP
语音
) VoIP SDK
的
反馈
、
、
我在一家小公司工作,我
的
老板告诉我在市场上四处寻找一个
语音
/视频SDK。我找到了一个叫做Ozeki SDK
的
VoIP。 根据他们网站上
的
描述,这看起来很有希望。如果有人已经使用过这个SDK,请与我分享一些想法,这样我就可以给我
的
老板一个更好
的
报告。
浏览 0
提问于2012-06-11
得票数 4
1
回答
一种公开VSCode活动“当子句上下文”
的
方法
、
为了让您更好地理解我
的
用例,下面是正在开发VSCode扩展
的
项目的一些背景知识。我
的
扩展将方便编程和通过
语音
控制VSCode。 有限
的
键盘组合和并非所有功能都可以通过快捷方式
调用
。“拆分成行”:r(键(“cs-p”)+
文本
(“拆
浏览 5
提问于2017-04-12
得票数 2
回答已采纳
7
回答
Amazon Alexa:存储用户的话
、
、
我是编写Alexa技能
的
新手,我想写一种技能来存储演讲者的话。{ "intent" : "SaveIntent"}SaveIntent save SaveIntent
浏览 1
提问于2016-05-16
得票数 22
1
回答
语音
识别自学习模型?
浏览 149
提问于2022-06-15
4
回答
luis.ai与
api
.ai与wit.ai
的
比较?
、
、
、
有没有人知道三者之间
的
具体区别和功能,或者作为开发人员是否有更多
的
功能/更灵活
的
使用?
浏览 74
提问于2016-05-14
得票数 82
回答已采纳
1
回答
输入方法中
的
光标移动与
文本
检索
、
目前,我有一个可访问
的
触摸屏键盘,使用类似于IOS/VoiceOver
的
方法,因此项目的一
部分
是在IME框架中完成
的
,而且相当直接。目前,Android
的
可访问性
API
没有为导航
文本
字段提供可访问
的
反馈。目前,我有关于左右箭头
的
语音
反馈,使用getCurrentInputConnection.getTextBeforeCursor(1,0)来表示左箭头,以及类似的右箭头
调用
。这将在处理移动
浏览 6
提问于2011-01-05
得票数 1
13
回答
如何让Python说话
、
我怎样才能让Python说出一些
文本
呢?有没有Python TTS库?就像节日
的
应用程序接口,eSpeak,...?
浏览 1
提问于2009-10-23
得票数 71
回答已采纳
3
回答
带有epoll和线程
的
套接字服务器
、
、
、
、
我试图在C中为协作实时编辑器创建一个套接字服务器,但我不知道它
的
最佳服务器架构是什么。首先,我试图为套接字服务器使用select,但在那之后,我读到了有关epoll
的
内容,现在我认为epoll是最好
的
选择,因为客户端将发送每封信,用户将在textarea上写信给服务器,因此服务器将拥有要处理
的
数据分配我
的
计划是 第二个线程将有从客户端读取和发送数据
的
任务。我
的
问题是,对于线程使用epo
浏览 6
提问于2011-11-28
得票数 7
回答已采纳
1
回答
在Google助手应用程序中读取用户联系人
、
、
、
我正在尝试为我
的
消息应用程序添加谷歌助理会话功能。 我已经实现了1和2
的
对话,但我无法实现3和4。我没有找到任何博客/源代码,它显示了如何选择联系人。这有可能吗?
浏览 1
提问于2020-04-28
得票数 0
回答已采纳
点击加载更多
相关
资讯
语音转文本,文本转语音:OpenAI 发布了 2 套新模型,1 个新网站
别发微信语音行吗,咱们好好打字
咱们好好打字,别发微信语音行吗
OpenAI发布语音模型GPT-realtime
2018 DUI平台首次更新 升级公告
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券