首页
学习
活动
专区
圈层
工具
发布
首页标签语音识别

#语音识别

专业智能高效的语音处理服务

语音验证码接口开发手册:面向研发人员的API技术实现流程

用户11968328

在研发场景中,语音验证码接口开发是保障用户身份验证、提升业务安全性的核心环节,多数开发者在对接该接口时,常面临参数配置错误、鉴权失败、兼容性适配难等问题。本文聚...

2410

实时交互型钓鱼套件驱动的语音钓鱼攻击机制与防御研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着多因素认证(MFA)技术的广泛部署,传统的凭据窃取攻击面临巨大挑战,迫使网络犯罪团伙转向更具交互性和欺骗性的攻击手段。近期,身份管理厂商Okta披露了一种新...

11110

基于稳定币场外交易的语音钓鱼资金清洗机制与链上溯源研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着区块链技术的普及与去中心化金融(DeFi)生态的演进,加密货币已深度嵌入全球支付与价值转移体系。然而,其匿名性、跨境流通的便捷性以及监管套利的空间,使其逐渐...

10210

韩国强制语音钓鱼赔偿政策的道德风险与防御博弈分析

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着电信网络诈骗手段的日益智能化与心理化,全球各国政府纷纷探索强化金融机构责任的监管路径。韩国政府拟议的强制性语音钓鱼(Voice Phishing)受害者赔偿...

10210

多语言语音识别AIoT方案全景解析:2026年智能设备如何打破语言壁垒

gavin1024

** 随着全球化进程加速,智能设备能否听懂并响应不同语言用户的指令,已成为决定其市场竞争力的关键。2026年,支持多语言语音识别的AIoT(人工智能物联网)方案...

16710

typeless的平替,这才是真正有用的语音软件软件——灵感速记!

用户5502619

用了这么多年的输入法,是不是还没听说过收费的?但最近一段时间,一款叫Typeless输入法却要210元/月(1000元/年),大家还排着队充值使用呢!

23410

大模型应用:TTA文本驱动音频:MusicGen大模型参数调优+音频情绪可视化.23

未闻花名

随着语音大模型的普及,不管是TTS还是ASR,都与音频处理有着紧密的联系,AIGC的蓬勃发展,也催生了文本到音频(Text-to-Audio, TTA)的落地场...

27310

大模型应用:完整语音交互闭环:TTS+ASR融合系统可视化场景实践.22

未闻花名

ASR,全称Automatic Speech Recognition,语音交互的耳朵,即自动语音识别,核心作用是 “把语音转换成文本”,相当于给机器装上耳朵,让...

28200

大模型应用:语音转文本(ASR)实践:OpenAI Whisper精准转录解析.21

未闻花名

ASR,全称Automatic Speech Recognition,即自动语音识别,核心是把人类说话的音频信号转换成文字。日常用的微信语音转文字、会议纪要自动...

60110

大模型应用:文本转语音实践:Tacotron2预训练模型和SpeechT5模型应用.19

未闻花名

前期我们了解了TTS的基础应用,今天我们继续探索两个强大的TTS模型:Tacotron2和SpeechT5。Tacotron2作为经典的序列到序列TTS模型,以...

16710

言出法随 -- Chaterm如何通过ASR精准操作K8S

腾讯云开发者

然而,碰到的第一个挑战就是,如何让传统的语音识别,能够100%准确的转化成各个云平台API,或者K8S,Linux的操作指令?

21611

XTrans技术实践:基于腾讯云ASR引擎的录音转文字与字幕生成解决方案

AI推荐小柚子

在音视频内容处理领域,高精度的语音转写与高效的字幕生成已成为众多开发者、内容创作者及企业的核心需求。市场上虽然工具众多,但往往在技术架构、识别准确率,特别是对复...

18810

语音AI技术为言语障碍者带来语音革命

用户11764306

Voiceitt语音识别团队负责人Filip Jurcicek表示,识别非标准语音与普通语音识别在一些根本方面存在差异。

10310

跨话语重评分实现更具包容性的语音识别

用户11764306

在一篇入选ICASSP前3%的优秀论文中,某中心的研究人员通过改进基于图的标签传播技术,提升了针对非标准发音的语音识别性能。

12810

Google推出MedGemma1.5驱动的下一代医学影像解析与MedASR医疗语音识别系统

DrugAI

人工智能在医疗领域的应用正以前所未有的速度加速推进,医疗行业采用 AI 的速度已达到整体经济体系的两倍。顺应这一趋势,Google 去年通过 Health AI...

12510

对话式AI:端到端语音识别与算法公平性研究进展

用户11764306

2022年,语音领域规模最大、最全面的国际学术会议Interspeech在韩国仁川举行。某中心作为白金赞助商出席。某中心语音AI组织的几位资深科学家重点介绍了该...

16410

无需重新训练即可为语音识别器添加新词

用户11764306

近年来,自动语音识别(ASR)已转向全神经网络模型。连接时序分类(CTC)损失函数因其预测不依赖于先前上下文,从而产生推理延迟低的简单模型,成为端到端ASR的一...

11410

智谱语音识别大模型开源,支持中国方言,消费级显卡本地部署

Ai学习的老章

语音识别模型我之前都是用Belle-whisper-large-v3-zh,小巧、快速,但是方言支持和准确性差一点意思。最近智谱Z.AI 开源了 GLM-ASR...

40210

利用自然语言理解标签优化语音识别重评分模型

用户11764306

第二遍语言模型通常用于对自动语音识别生成的假设进行重评分。研究表明,通过在训练中融入自然语言理解的目标任务,可以提升这类重评分模型的性能。

7810

相关产品

  • 语音识别

    专业智能高效的语音处理服务

活跃用户

  • gavin1024

    2.4K 文章78.8K 回答0 关注
领券