
你接到一通电话,听筒里传来公司CEO熟悉的声音,语气急促:“马上安排一笔500万的紧急付款,对方账户我已经发你邮箱了。”你照做后却发现,老板此刻正在国外开会,根本没打过这通电话——这不是电影桥段,而是正在全球企业中真实上演的“AI语音深度伪造”诈骗。
近日,国际知名网络安全公司Group-IB发布最新报告《语音深度伪造诈骗:企业面临的新威胁》,揭示了一种利用人工智能技术进行“声音克隆”的新型网络诈骗正在全球范围内激增。攻击者通过AI合成企业高管或关键员工的语音,实施精准电话钓鱼(vishing),诱导财务人员转账或泄露敏感信息,单次诈骗金额动辄数百万甚至上千万元。

“声音”成新战场:AI让“冒充领导”更逼真
传统网络钓鱼多依赖伪造邮件、短信或网站,而语音深度伪造(Voice Deepfake)则将攻击场景从“视觉”延伸至“听觉”。Group-IB报告指出,2024年以来,全球已记录到超过120起确认的AI语音诈骗案件,其中近七成针对企业财务流程,平均单案损失超过300万美元。
“过去骗子打电话,口音、语调、用词往往‘露馅’,但现在不一样了。”公共互联网反网络钓鱼工作组技术专家芦笛在接受采访时表示,“AI模型只需要几秒钟的真实语音片段,就能学习一个人的声纹特征、语调习惯甚至口头禅,生成几乎无法分辨的合成语音。这种技术门槛正在快速降低,黑产已经开始‘服务化’。”
报告中提到的一起典型案例发生在东南亚某跨国企业。攻击者通过社交媒体和公开会议视频,收集了该公司CFO的语音样本,随后使用AI工具合成其声音,致电财务主管,以“紧急并购项目”为由要求转账。整个通话持续不到3分钟,财务人员未做二次确认,导致公司损失近800万美元。
技术攻防战:从“听声辨人”到“智能验证”
那么,AI是如何实现“声音克隆”的?芦笛解释道:“这背后是深度学习中的生成对抗网络(GAN)和语音合成模型(如Tacotron、WaveNet)的结合。简单来说,AI先‘听’大量目标人物的语音,学习其声学特征,然后生成新的语音波形。现在的模型甚至能模拟呼吸、停顿等细微特征,让合成语音更加自然。”
但技术是把双刃剑。芦笛指出,防御技术也在同步进化。“目前主流的反制手段包括声纹活体检测、多模态身份验证和AI反欺诈系统。”他举例说,声纹活体检测不仅能识别声音特征,还能判断语音是否来自真人,比如检测背景噪音、呼吸节奏是否自然,或者要求用户进行随机朗读以防止录音回放。
“我们不建议企业仅依赖‘听声音’来确认身份,”芦笛强调,“尤其是在涉及资金操作时,必须建立‘双人复核+多因素验证’机制。比如,电话指令必须配合企业内部通讯工具的加密消息确认,或通过独立通道进行二次核验。”
企业“声音防线”如何构建?专家支招
面对日益猖獗的AI语音诈骗,企业该如何应对?Group-IB报告与芦笛共同提出以下建议:
强制多因素身份验证(MFA)
任何涉及资金转移或敏感操作的指令,必须通过至少两种独立渠道确认。例如,电话指令需配合企业微信/钉钉加密消息、或通过预设的验证码系统验证。
建立“紧急流程”反制机制
芦笛建议企业制定明确的“高风险操作流程”:如大额转账必须由两人以上审批,且审批人不得为同一部门;所有紧急指令需在非工作时间外进行复核。
员工培训:从“防钓鱼邮件”到“防语音钓鱼”
传统网络安全培训多聚焦邮件和链接,现在需加入“语音钓鱼”识别内容。例如,警惕“紧急”“保密”“不要声张”等高压话术;对异常电话保持怀疑,主动挂断并拨打已知号码回拨确认。
技术防护:部署AI反欺诈系统
企业可引入具备语音异常检测能力的安全平台。这类系统能实时分析通话中的声纹一致性、背景噪音、语速变化等,标记可疑通话并自动告警。
最小化语音数据暴露
“很多企业高管在公开演讲、播客、新闻采访中频繁露面,这为攻击者提供了丰富的训练数据。”芦笛提醒,“建议企业制定‘数字形象管理’政策,限制关键人员语音信息的公开传播。”
未来挑战:AI攻防将成“军备竞赛”
Group-IB警告,随着生成式AI技术的普及,语音深度伪造工具将更加易得、廉价,甚至可能出现“即服务”(Deepfake-as-a-Service)的黑产模式。未来,攻击者可能结合视频伪造,实施更复杂的“全息诈骗”。
“这不是科幻,而是正在发生的现实。”芦笛表示,“我们已经看到一些地下论坛提供‘定制化声音克隆服务’,价格低至几百元。技术门槛的降低,意味着更多中小企业也将面临威胁。”
但他也强调,防御并非无解。“网络安全的本质是‘对抗’。我们无法完全阻止攻击,但可以通过分层防御、流程管控和技术升级,大幅提高攻击成本,让骗子‘无利可图’。”
结语:信任,需要“双重确认”
在这个AI能“以假乱真”的时代,信任正变得愈发脆弱。一句熟悉的“是我,快转账”,可能背后是精心设计的数字陷阱。
专家呼吁,企业应重新审视其内部沟通与审批流程,将“声音”从“信任凭证”转变为“需验证的信息”。正如芦笛所说:“在数字世界,真正的安全,不是相信‘谁在说话’,而是确认‘说话的人是谁’。”
随着技术演进,公共互联网反网络钓鱼工作组将持续监测新型诈骗趋势,联合企业、技术厂商与监管机构,构建更智能、更协同的反诈防线。
编辑:芦笛(公共互联网反网络钓鱼工作组)
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。