首页
学习
活动
专区
圈层
工具
发布
首页标签语音识别

#语音识别

专业智能高效的语音处理服务

EM算法

只喝牛奶的杀手

手上有一堆数据,明明知道里面有规律,却总有一些关键信息 缺了 ——不知道用户属于哪类人群,不知道一个样本到底该归到哪个类别……

8510

【腾讯位置服务开发者征文大赛】当 AI 听懂城市的低语——用腾讯位置服务打造智能情感地图小程序

悟空码字

每一座城市都在低语——老街的梧桐树下,藏着只有下午三点才透进来的光;巷尾的咖啡馆里,有最适合发呆的角落和旧时光的味道。但这些信息,地图听不见。

22730

跨学科交叉:语音识别与合成的联合训练

用户11764306

语音合成与语音识别模型的循环训练,以及为了更好语音韵律而进行的语言理解,仅仅是语音相关领域交叉融合的几个例子。

7510

Alexa对话AI的技术进展与创新

用户11764306

准确的远场自动语音识别(ASR)对于与 Alexa 的自然交互至关重要。继续在这一领域取得进展,在 Interspeech 2020 上,展示了12篇论文,包括...

9810

人工智能之语音领域 语音处理 第六章 语音处理技术发展趋势与未来展望

咚咚王

尽管语音处理技术取得了显著进展,但在复杂场景下的表现仍有待提升。远场语音识别、高噪音环境、多人同时说话等场景下,识别准确率仍然面临挑战。这些场景中,语音信号容易...

22510

人工智能之语音领域 语音处理 第五章 语音处理实践落地与常见问题解决

咚咚王

Hugging Face Transformers:提供wav2vec 2.0、Whisper、VITS等预训练模型

15400

网络钓鱼攻击特征识别与多维度防御技术研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

网络钓鱼是当前最普遍、危害最突出的网络安全威胁类型,攻击者依托伪造邮件、短信、社交信息与虚假网站,结合社会工程学手段诱导用户泄露敏感数据或执行恶意操作,对个人信...

37310

人工智能之语音领域 语音处理 第四章 语音与文本、图像的多模态融合应用

咚咚王

多模态融合是指将语音、文本、图像三种不同模态的信息进行整合、互补,利用各模态的优势,提升模型的性能和应用场景的适配能力。其中,语音提供听觉信息,文本提供语义信息...

14510

语音钓鱼(Vishing)统计特征、技术机理与全链路防御研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

语音钓鱼(Vishing)依托号码仿冒、AI 语音克隆与实时社会工程学交互,已成为 2025—2026 年全球增长最快的网络攻击形式之一。SQ Magazine...

17310

人工智能之语音领域 语音处理 第二章 语音处理核心技术

咚咚王

ASR、TTS和声纹识别作为语音处理的三大核心技术,各自拥有完整的技术体系和应用场景。通过深入理解其核心技术流程、性能影响因素和主流模型演进,可以更好地设计和优...

22710

跨部门协同治理下语音钓鱼防控效能提升与技术实现研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

本文以韩国政府跨部门电信金融诈骗综合应对小组成立半年来的治理实践为研究样本,结合警方公开数据与技术防控机制,系统分析语音钓鱼案件数量下降 31.6%、涉案损失下...

17810

人工智能之语音领域 语音处理 第一章 语音处理基础入门

咚咚王

语音处理是一门融合信号处理、计算机科学、语言学、声学等多学科的技术,核心是对语音信号进行采集、分析、转换、合成、识别等操作,实现"机器听懂语音""机器说出语音"...

14710

相关产品

  • 语音识别

    专业智能高效的语音处理服务

活跃用户

  • gavin1024

    3.1K 文章80.5K 回答0 关注
领券