首页
学习
活动
专区
圈层
工具
发布
首页标签语音识别

#语音识别

专业智能高效的语音处理服务

XTrans:基于腾讯云ASR与DeepSeek的语音转录校验系统技术方案

AI推荐小柚子

XTrans 是一个面向高准确率语音转文字需求的系统,采用腾讯云语音识别(ASR)作为基础转写引擎,结合DeepSeek大语言模型进行转录后文本校验与纠错,旨在...

600

仿冒快递短信竟能盗走百万账户?Google重拳起诉“Smishing三合会”,中国专家警示国内短信钓鱼已进入产业化阶段

草竹道人

中国互联网络信息中心 | 工程师 (已认证)

这些看似来自政府机构或科技巨头的短信,正成为美国消费者最危险的数字陷阱。据CNBC 2025年11月12日报道,Google已正式向美国联邦法院提起诉讼,剑指一...

1800

一通电话撬开哈佛数据库:Vishing攻击如何绕过防火墙,直击“人肉漏洞”?

草竹道人

中国互联网络信息中心 | 工程师 (已认证)

世界顶尖学府哈佛大学发布了一则低调却令人警醒的公告:其内部部分数据库遭遇未授权访问,泄露信息涵盖校友、捐赠者及部分师生的个人资料。令人意外的是,这次入侵并非源于...

4310

AI“守门人”上线!韩国电信与银行联手用智能语音识别阻击语音钓鱼,中国反诈技术迎来新启示

草竹道人

中国互联网络信息中心 | 工程师 (已认证)

面对这一挑战,LG U+与KB国民银行选择了一条“端到端协同防御”的技术路线。其核心产品名为 ixi-O,由LG U+主导开发,整合了语音识别(ASR)、自然语...

12310

告别手写记录:如何选择最适合你的语音转换文字软件?

AI推荐小柚子

在会议记录、课程学习或内容创作时,你是否曾为反复回放录音、逐字手打而效率低下感到烦恼?语音转换文字软件的出现,彻底改变了这一传统工作模式。本文将带你全面了解这类...

7900

AI模型解码海豚语言通信技术

用户11764306

数十年来,理解海豚的咔嗒声、哨声和爆发脉冲一直是一个科学前沿。如果我们不仅能倾听海豚的声音,还能充分理解它们复杂通信的模式以生成逼真的回应,会怎样?

10410

Alexa发布全新语音识别与语音合成技术

用户11764306

Alexa的自动语音识别系统也进行了全面改革——包括机器学习模型、算法和硬件——并正在转向一个新的基于LLM架构的大规模文本转语音模型,该模型基于数千小时的多说...

11510

ICASSP前沿:多领域AI与语音技术研究概览

用户11764306

14810

降低语音代理不必要澄清提问的新方法

用户11764306

当两个人在嘈杂环境中交谈,其中一人若未听清或理解对方意图,很自然地会请求澄清。语音代理(如某中心的Alexa)也是如此。为了避免基于不准确或不完整的理解采取潜在...

10210

提升智能语音交互准确性的核心技术解析

用户11764306

免唤醒词模式让与智能助手的交互更加自然。启用此模式后,用户可以先询问“今天的天气怎么样?”,接着直接说“明天呢?”,而无需重复唤醒词“Alexa”。省略唤醒词意...

11000

ICASSP 2024信号处理技术前沿概览

用户11764306

某中心在本次会议上发表了超过20篇学术论文,研究重点主要集中在自动语音识别,同时也广泛涉及语音增强、口语理解、唤醒词识别、对话、副语言学、音高估计及负责任的人工...

17210

仿冒政府网站钓鱼攻击的识别机制与防御策略研究

草竹道人

中国互联网络信息中心 | 工程师 (已认证)

2025年11月,美国联邦调查局(FBI)发布紧急警报,指出网络犯罪分子正大规模部署高度仿真的虚假互联网犯罪投诉中心(IC3)网站,以窃取公众的个人身份与金融信...

15810

基于电话钓鱼的社会工程入侵路径分析与防御机制研究——以哈佛大学数据泄露事件为例

草竹道人

中国互联网络信息中心 | 工程师 (已认证)

近年来,随着网络安全防护体系在技术层面的不断加固,攻击者日益转向利用人类认知弱点实施社会工程攻击。2025年披露的哈佛大学数据库泄露事件即为典型案例:攻击者并未...

16200

生成式语音合成驱动下的语音钓鱼攻击与身份核验挑战

草竹道人

中国互联网络信息中心 | 工程师 (已认证)

随着生成式人工智能技术的快速发展,语音合成与语音克隆能力显著提升,其在语音钓鱼(vishing)攻击中的应用正对传统身份验证机制构成严峻挑战。本文基于Ident...

14110

自动语音识别新技术与模型优化

用户11764306

作为致力于语音技术的最大会议,Interspeech一直是展示某中心语音助手在自动语音识别(ASR)领域最新研究成果的平台。今年,该语音助手的研究团队有12篇A...

25810

隐马尔可夫模型

贺公子之数据科学与艺术

隐马尔可夫模型(Hidden Markov Model, HMM)是一种经典的统计模型,常用于处理时序数据,如语音识别、自然语言处理和生物信息学等领域。通过一个...

20110

[python]基于faster whisper实时语音识别语音转文本

用户11754185

语音识别转文本相信很多人都用过,不管是手机自带,还是腾讯视频都附带有此功能,今天简单说下:

25010

HarmonyOS第一课——HarmonyOS Intelligence与AI能力开放会给我们带来什么样的价值

红目香薰

HarmonyOS第一课中的首席专家讲鸿蒙课程中HarmonyOS Intelligence与AI能力开放课程中对Harmony Intelligence的整体...

26810

相关产品

  • 语音识别

    专业智能高效的语音处理服务

活跃用户

  • gavin1024

    2.1K 文章91.6K 回答0 关注
领券