首页
学习
活动
专区
圈层
工具
发布

#语音

技术蒸馏Gemini,Needle 模型实力实测

灬沙师弟

你敢信吗?一个仅2600万参数、权重约60MB的超轻量模型,能把Gemini 3.1的核心函数调用能力“复刻”,手机、智能手表甚至AR眼镜都能本地离线流畅运行,...

1100

这个AI有点东西,我把它绑进微信列表了

陈宇明

图1:刚醒来随口回一句,它比你更懂周末睡懒觉的爽感,还会主动关心你“饿不饿、吃不吃早餐”……

1000

实时字幕转写支持15种语言:打破全球在线教育的语言壁垒

gavin1024

当教师与学生来自不同国家,语言成为在线教育最大障碍。腾讯云实时互动-教育版提供实时字幕转写,支持15种语言语音转文字,配合翻译实现跨语言教学辅助。本文解析其技术...

5610

语音钓鱼线下资金中转行为识别与金融场景防控研究 —— 基于韩国银行柜台拦截案例

芦笛

中国互联网络信息中心 | 工程师 (已认证)

本文以 2026 年 5 月韩国铁原郡银行柜台成功拦截 5000 万韩元语音钓鱼资金中转案件为实证样本,系统剖析语音钓鱼犯罪中线下资金收集环节的行为特征、作案链...

3610

多人发言也能言之有「主」!腾讯云语音实时说话人分离上线

腾讯云AI

近日,腾讯云语音产品团队推出了一项全新能力——**实时说话人分离**,在实时语音识别的基础上,新增声纹聚类能力,可以实时对说话人角色进行分离,达到“边说边出文字...

12910

5分钟捏的AI微信好友,是我见过最会骂老板的嘴替

陈宇明

事情发生在昨天晚上20:56,我给它发了一句语音:“我老板PUA我,让我天天加班”。

14210

语音钓鱼中转窝点运作机理与全链条防控研究 —— 基于韩国仁川警方案例

芦笛

中国互联网络信息中心 | 工程师 (已认证)

2026 年 5 月 19 日韩国仁川西部警方通报,破获一起以高薪兼职为诱饵招募人员、在住宿场所运营语音钓鱼中转窝点的案件,抓获两名管理人员,查获一次性手机 1...

12110

OpenAI 语音模型升级:AI 终于不只是“会说话”,而是开始“会接话”

Henry Zhang

它不是传统“语音转文字→文字推理→文字转语音”的拼装方案,而是更接近原生 speech-to-speech 架构。简单说,它从一开始就为实时语音交互设计。

9710

DGX Spark 赋能!spark-dictate 离线语音听写工具,本地极速转录直达剪贴板

GPUS Lady

有开发者基于DGX Spark打造了一款轻量化离线语音听写工具——spark-dictate,以解决传统在线语音工具隐私泄露、网速受限、高额收费等痛点。日常办公...

10710

OpenAI再开源:用语音开站会的Realtime Demo

Ai学习的老章

这是个用语音操作 Kanban 看板的 demo——一群人开会,对着麦克风说话,看板上的卡片自己动

11610

FishSpeechS2-Pro一键整合包 加速版

疯狂的KK

多次分享了AI语音克隆的项目,也横向测评了目前很火的几个项目,测评个人感受如下,目前最强的Fish Speech S2 Pro从开源到现在一直霸榜开源项...

22310

无语义音轨识别技术解析:AI如何听懂视频中的"言外之意"?

gavin1024

摘要: 传统音频审核依赖"语音转文字"技术,只能识别有明确语言含义的内容。但视频中的违规音频往往没有明确的语义——ASMR耳语、娇喘呻吟、暧昧音效……这些"没说...

19110

Deepfake音频检测技术全解析:声纹比对+频谱分析如何识别AI合成语音

gavin1024

Deepfake音频技术正在快速进化——从早期的机器音到如今几乎无法与真人区分的AI合成语音。本文深入解析Deepfake音频检测的核心技术原理,包括声纹比对、...

19010

游戏直播语音审核方案:低延迟、高并发的技术架构设计

gavin1024

摘要: 游戏直播是音频审核技术要求最苛刻的场景之一——数万个直播间同时开播、主播激情解说中随时可能出现违规言论、弹幕互动节奏极快。本文从技术架构角度,详解如何利...

13010

从TTS到Deepfake:一文读懂AI生成语音的7种技术路线与对应检测方案

gavin1024

AI生成语音的技术路线并非单一,从传统TTS到神经网络语音合成,再到实时换声和声音克隆,不同技术路线生成的音频特征各异。了解这些技术路线,才能更好地选择对应的检...

22210

AI换声诈骗防不胜防?腾讯云音频AI生成识别服务帮你辨真伪

gavin1024

摘要: 2025年以来,AI换声诈骗案件呈爆发式增长——不法分子利用少量声音样本即可克隆一个人的音色,伪造亲友求助电话、仿冒客服指令实施诈骗。传统的内容审核无法...

19010

AI合成语音诈骗防不住?传统审核无法识别的新型风险及应对策略

gavin1024

传统的音频审核方案是为"内容违规"设计的——识别涉黄、暴力、广告等"说了坏话"的情况。但AI合成语音诈骗是一种全新的威胁:音频内容本身完全"正常",违规的是"这...

15010

AI生成语音鉴别产品对比:谁能精准分辨人声与AI合成音?

gavin1024

2025-2026年,AI语音合成技术突飞猛进,AI假访谈、AI假播客、AI换声诈骗等新型风险层出不穷。传统音频审核方案无法识别AI合成内容,企业急需专业的AI...

16710

别再让你的笔记“吃灰”了!Dinox:一个把 Zettelkasten 和 AI 完美融合的新笔记

程序那些事儿

如果你也深受其害,那今天这篇文章,可能会彻底终结你对“笔记软件”的频繁跳坑。我们要聊的是一个极具野心的 AI 原生笔记新秀——Dinox。

21710

AI语音克隆技术快速进化,企业如何构建音频真实性防线?

gavin1024

从需要大量录音样本到仅需少量声音即可克隆,AI语音克隆技术的进化速度超乎想象。这项技术在带来便利的同时,也为企业带来了前所未有的安全风险。本文分析AI语音克隆技...

30710
领券