Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >独家解密!B站up主用千亿级参数模型训练出的AI小姐姐,竟让骗子倒贴520

独家解密!B站up主用千亿级参数模型训练出的AI小姐姐,竟让骗子倒贴520

作者头像
新智元
发布于 2023-02-24 05:22:08
发布于 2023-02-24 05:22:08
3970
举报
文章被收录于专栏:新智元新智元


新智元报道  

编辑:编辑部

【新智元导读】杀猪盘有套路,AI也有套路。AI对上骗子,用魔法打败魔法,让人拍手称快。

B站up主「图灵的猫」曾做过一期AI小姐姐大战杀猪盘骗子的视频,近日,这个视频已经突破了200万播放量!

作为B站知名科技区KOL,「图灵的猫」的视频一向人气很高。为什么这一期的流量尤其之高呢?

这是因为,用AI对话机器人让骗子一步一步露出马脚的过程,实在看得人大快人心!

你知道,全国有多少人收到过诈骗信息吗?4.38亿!

这个数字占人口总数的32%,相当于每三个人中,就有一人受到过诈骗信息的骚扰。

同时,随着技术的发展,诈骗分子的手段也越来越新奇,杀猪盘、网络兼职、疫情诈骗、虚拟投资诈骗层出不穷。

被诈骗的对象也不仅限于老人和小孩,有不少高知、白领、大学生,都是诈骗的受害者。

更有甚者,深陷网络杀猪盘的女性受害者,既破了财,精神上还遭受了极大打击,甚至付出了生命的代价。

诈骗分子玩的是哪些新套路?如何辨别新型诈骗手段?我们又该怎么利用AI技术护身防骗?

AI反诈论坛,教你利用AI技术,以魔法打败「魔」法!

此次论坛由新智元CEO杨静女士主持,邀请到浪潮信息算法研究员张辉博士,以及B站AI领域头部UP主「图灵的猫」共同参与讨论。

AI:没人比我更懂诈骗

很多人都觉得,受害人上当,是因为不够聪明。

可是,有那么多白领和高知,他们的知识修养和文化水平都不低,怎么还会上当呢?

张辉博士介绍说,人会受骗,是因为一个人再怎么渊博,也不可能拥有全面的知识,不可能了解所有的诈骗案例。

而再聪明的人,都难免有感情用事的时候。在某些氛围或场合下,就无法理智地做出判断。

可是谁能克服这些缺陷呢?

没错,AI就可以!

在反诈知识的储备上,它比人充分得多,因为经过大数据学习,它见过太多的诈骗案例。

而且,人虽然会感情用事,但AI在任何时刻都是理智的。

甭管是和什么人,在什么环境下聊天,AI统统一视同仁,既不会见钱眼开,也不会冲动做事。

所以,面对网络诈骗,AI可以充当人的助手,衍生人的能力,补足人的弱点。

杀猪盘:「虾仁」又「猪心」

诈骗案中,非常可恶的一种就是杀猪盘。杀猪盘的很多案例,看起来都触目惊心。

许多向往爱情的「乖乖女」,在婚恋网站上不幸跌进杀猪盘的陷阱,以为自己开启了一段爱情童话,殊不知自己在对方眼里不过就是待宰的「猪」。

设立人设,寻找猎物,剧本撰写,专职聊天,再到技术支持,专业骗钱等,杀猪盘的每个环节都有分工,施骗过程如同一条工业流水线。

这些受害人,轻则遭受几十万、上百万的财产损失,重则付出生命的代价……

2019年,海南一位24岁的女生结束了自己的生命,她在遗书上这么写道:「亲爱的爸爸妈妈,原谅女儿在今日选择结束自己的生命……被骗了20几万元无力偿还,挪用了爸爸6万7千元,借了十几万贷款,还欠朋友们几万元,你们养育我这么多年,我却做了这些对不起你们的事……我只能选择了结自己这一生……」

而和她一样的杀猪盘受害者,还有很多个。

面对这类案件,大家的第一反应往往都是受害人太过单纯,可怜又可笑。但如同我们在开头讲到的,这是一种偏见。

B站up主:用AI大战骗子

B站知名up主「图灵的猫」,曾经采用了浪潮的源技术,再用B站评论对AI进行微调,训练出来一个像魔法一样的反诈AI。这个视频在B站,已经获得了将近200万的播放量。

在论坛中,杨静女士向「图灵的猫」提问道:什么会有这样一个想法呢?

「图灵的猫」解释道,首先是因为,在最近几年,人工智能的对话模型进步非常大。

既然技术进步这么快,连骗子诈骗都开始用AI,那能不能发扬「科技向善」的理念,做一个可用的反诈AI呢?

经过调研以及和浪潮的合作,他和团队决定尝试做了一个反杀猪盘AI。

开始,他们用的是最初的API模型,虽然对话能力不错,但是在场景化的表达上,就不太好了。

骗子都是别有意图,跟骗子聊天,都是有剧本的。

为了让AI表现更自然,他们在B站、贴吧的热门评论中,找了很多语料,去给模型微调。

因为这些评论相当于回复和被回复的对话关系,就像我们平时在网上聊天一样,而基于这种关系,就可以更好地去发掘和利用它们,抽取出语言的形式,然后让AI模仿。

在测试中,这个AI的效果非常不错,视频在B站已经有了接近200万的播放。

「图灵的猫」认为,自己做的事最大的意义,就是提高公众对于杀猪盘的警惕,并且提供一种利用技术进行反诈的思路。

杨静女士接着提问道:那反诈AI是如何在与骗子的对话中,识别出杀猪盘的套路呢?

图灵的猫回答说,杀猪盘的套路都是有限的,很多骗子会用固定种类的借口来「杀猪」  。

在AI的后台,就可以设立一个监控系统,一旦触发了某些关键词,就可以认为去观察和干预。

而对于不同关键词,骗子都是有一套逻辑的,我们就可以让AI反着这个逻辑,有一套对应的话术,诱导骗子露出马脚,帮助破案。

「小源」为何如此智能?

杨静女士向「图灵的猫」问出一个大家都很感兴趣的问题:怎么能让诈骗犯意识不到,与自己对话的是一个AI呢?

「图灵的猫」解释道:首先,「源1.0」模型本身的知识储备就非常大,而基于这个模型的知识储备,就可以做一些更深层的应用。比如,可以用一些短字数的评论去训练和引导AI,让它更加拟人。

如此一来,「小源」就区别于那些动辄发表长篇大论的长文本AI,可以用短句和分段表述,聊起天来就更加日常。

其次,在「杀猪盘」中,对于不同关键词,骗子都是有一套逻辑的。而我们恰恰可以让AI反着这个逻辑,为骗子准备一套话术。

比如他想骗你钱时,你就以其人之道,还治其人之身。

那在「图灵的猫」的项目中,浪潮的源1.0发挥了怎样的作用呢?

张辉博士解释道,源1.0在反诈AI中承担的是对话引擎,也就是说,对于对面聊天的这个人提出的任何问题,都是由源大模型给的答案。

源1.0是一个预训练模型,注重通用性的聊天,但是在反诈AI中,就要达到有目的的聊天,剧本式的聊天,场景化的聊天。

这时候,源1.0就可以很方便地外挂知识库,或者外挂语料库,这样,我们就可以实时更新知识、更新剧本、更新场景,开发出非常多人设稳定、自由交流通畅,而且能达到有目的对话的引擎或机器人。

项目地址:https://github.com/Turing-Project/AntiFraudChatBot

杨静女士又提问道:作为反诈AI的大脑和灵魂,源1.0大模型为什么在高频的闲聊和知识对话中,表现得如此智能?

张辉博士回答说,作为一个预训练的语言模型,源1.0之所以具备全才的大脑和有趣的灵魂,是因为学习了大量数据量,达到了5TB。

这5TB的高质量数据,来源于2017年到2021年之间,互联网开源的800多TB文本数据。在过滤筛选后,浪潮筛选出来了这5TB的精华。

而学习过大量文本数据以后,源1.0大模型已经具备非常好的语言知识和通用的领域知识,非常全才。

相比GPT-3,「源1.0」在参数规模上领先了40%,在训练数据集规模上领先了近10倍

为了支持开发者,浪潮已经建了源大模型开源开放平台。目前有2800多位开发者入驻了该平台,进行了各种有意思的上层AI应用。

此外,平台不仅开源了推理API,还开源了非常多的数据集代码,并且向开发者提供低代码或者零代码。

不需要具备算法专业的知识,就可以开发出非常多有意思的应用,浪潮也非常欢迎大家去试用。

模型官网:https://air.inspur.com/home

现在,源2.0大模型马上要发布了。

可以期待,在未来,我们的算法基础平台会进一步升级,面对骗子,我们能够「道高一丈」。

而杨静女士提问道:无论是源1.0,还是最近的ChatGPT,对话起来都接近真人。我们知道,很多金融机构和电商平台,都会配有自己的AI客服助手。而现在这些厉害的AI模型,会不会被犯罪分子利用呢?

张辉博士回答说,现在还无法杜绝所有人都不用,但至少可以做到以下三点——

第一,开放平台在从申请到审核到使用的流程中,都会有非常强的跟进措施,保障开发者开发的AI应用是经过审核的,是合情合理的。

第二,保证不合理的信息不出现,让生成的内容可控。

第三,目前已经上线的这些客服,主要的功能还是辅助用户进行流程性的咨询,比如如何退款,如何修改密码,而闲聊功能只占其中很小的一块。

总之,这些客服都是可控的,风险很小,无须担心。

炼丹五年,释放千亿参数的巨量模型

现在很多新模型的参数动辄就是千亿,而源1.0预训练大模型的基础模型是2547亿。

这么大的规模,性能的提升就会依赖超大的训练成本,因此源1.0训练了五年。

杨静女士提问道:炼丹五年,完全体AI的预训练需要至少八位数的算力成本,能不能给大家普及一下大规模算力的实现过程,以及智算普惠释放的新价值?

张辉博士回答,我们的大模型学习了五年的互联网文本,但是它的学习速度其实很快,并不需要像人那样,真的学习五年。

论文地址:https://arxiv.org/abs/2110.04725

训练中,使用了2000多块GPU卡,整个训练的时间是16天左右,学习了5TB互联网上的高质量文本数据。

当然,并不是每个企业都花费巨大的算力资源,来训练这样一个自用大模型。

算力大模型现在可以作为一个算法的基础设施,就相当于AI能力的发电厂。

这种预训练大模型,其实是一次训练、广泛赋能,就像接入电力一样。在浪潮的开放平台上进行注册,就像插入一个插座一样,经过非常简单的调用,就可以使用预训练大模型的AI能力。

一个科技向善的未来

在论坛最后,杨静女士提问对两位专家提问道:未来的诈骗方式还会如何演进?AI技术在反诈上又能演进出哪些反套路?

张辉博士回答说:未来,骗子肯定会不断翻新花样,而我们的反诈技术,也会越来越先进。那时候的AI反诈技术不仅会帮助警察,还会帮到普通人。我们可以饱含期待。

而浪潮作为一个有社会担当的企业,一直在强调科技向善、科技助善。

例如,浪潮有一个助盲的项目,通过多模态识别、视觉识别,让盲人听到声音,还能把这些图像识别的内容转化成语音,让他们自由地交谈。

「图灵的猫」表示,针对现在的疫情,AI或许可以为大家提供一些居家的健康监测,比如接触阳性的概率、平时的血氧饱和度、体温等。

把这些大数据汇总分析后,或许会对独居老人和小孩提供预警,甚至主动对社区、派出所、医院报警或者告警。

总之,随着未来AI技术的进步,这些产品会更变得更完善、更普及,保障更多弱势群体的生命安全和财产安全,然后惠及每个人,提高我们的生活质量。

其实在国外也有不少,我相信随着未来AI技术的再次进步,这些产品能够做到更完善更普及,对于更多弱势群体来保障他们的生命生活,然后是财产安全,最后是生活质量,以及最后普及到每个人身上。

参考资料:

https://www.bilibili.com/video/BV1qD4y1h7io/?spm_id_from=333.337.search-card.all.click

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-01-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
网页编辑DWG框架搭建快速入门(WEB CAD SDK)
MxDraw网页CAD,它主要包括MxDraw开发包,MxCAD开发包,后端服务程序,图纸转换程序4个部分,其详细说明如下:
梦想云图网页CAD
2024/04/12
3340
网页编辑DWG框架搭建快速入门(WEB CAD SDK)
C#开发BIMFACE系列42 服务端API之图纸对比
在我的前一篇博客《C#开发BIMFACE系列41 服务端API之模型对比》中详细介绍了BIMFACE服务端接口模型对比的功能。 BIMFACE官方文档提供的三维模型对比接口同样也适用于二维CAD图纸对比。下图中是官方提供的对比示例程序。
张传宁IT讲堂
2021/10/13
5950
从0到1:美团端侧CDN容灾解决方案
CDN已经成为互联网重要的基建之一,越来越多的网络服务离不开CDN,它的稳定性也直接影响到业务的可用性。CDN的容灾一直由美团的SRE团队在负责,在端侧鲜有方案和实践。
美团技术团队
2022/01/25
1.1K0
从0到1:美团端侧CDN容灾解决方案
新版Chrome浏览器加载eDrawings 3D Viewer控件网页查看DWG、DXF
eDrawings是一款由达索系统(DASSAULT SYSTÈMES)开发的免费跨平台CAD看图工具,专注于3D模型和2D工程图的查看、协作与共享。其核心功能包括多格式支持、动态模型展示、跨平台适配及轻量化操作体验,适用于工程设计、教育培训等领域。
喵大侠
2025/05/28
2380
新版Chrome浏览器加载eDrawings 3D Viewer控件网页查看DWG、DXF
从运营到分发渠道,iSDK打造一站式手游解决方案
功能稳定强大之外,无隐性消费则是iSDK能够在乱象丛生的市场环境中,异军突起的另一主要原因。一别于其他同类型SDK接入产品,会在产品售出后设置一些价格相对较低的增值服务,iSDK选择了无隐性消费的即时
BestSDK
2018/03/01
1.5K0
从运营到分发渠道,iSDK打造一站式手游解决方案
找我培训、咨询(问问题)、外包、技术支持前,请先阅读
今天一位温州的朋友加我QQ,希望谈培训、技术支持的问题,挺典型的一个沟通过程,特整理下来,节省下次与其它人的沟通时间。
崔文远TroyCui
2019/02/26
5210
使用javascript多快好省绘制简单CAD图纸
[题引]:CAD(计算机辅助制图)是随着计算机技术发展而来的新技术,用于精确绘制。图纸上承理论设计,下接生产制造,重要性不言而喻。当前CAD软件种类繁多,但动辄1G+的计算机空间。若绘制简单CAD图纸,显得“杀鸡焉用牛刀”,本小节介绍使用轻量级的javascript编程绘制简单的CAD图纸。
周星星9527
2019/04/26
2.6K0
使用javascript多快好省绘制简单CAD图纸
CAD2023激活版下载-CAD2023(Autodesk AutoCAD 2023免费版安装教程
Auto CAD2023版本已经更新,新版外观风格大变,给人耳目一新的感觉流畅度有所提升。全新的2023版本拥有着非常强大的渲染、绘图和三维打印功能,还提供了动态块、文本设定、数据提取、三维导航、截面平面、DWG 比较、云存储连接等完整的功能。
用户10122115
2023/01/04
1.9K0
利用图像识别给CAD图纸找不同
本算法旨在对 CAD 图纸进行比对,通过一系列图像处理步骤,包括格式转换、边缘切割对齐、去噪、差值比对、腐蚀膨胀和标注归一,快速发现两幅 CAD 图纸之间的差异。原文地址:https://kns.cnki.net/kcms2/article/abstract?v=QenloEQs_R_P8kxDecokeBUD05QHydGF4xG_296KoAoDsp8OX7i3Q7IeoGFGj8KFvSSH-Re2Tuqm4QoRztSGCbWOodm65_GtpA1zMPijQCGheGM5ScU36ndre7Gv3rHLdvTX1nkIljt84rKdxM91ntHDJ4FfimYaVw5obiB1zsw=&uniplatform=NZKPT
Srlua
2024/11/27
3710
利用图像识别给CAD图纸找不同
Web3 的开发者,如何评估以及选择调用链上数据的解决方案
Footprint是链上数据分析平台以及数据处理基础设施,使命是让链上数据分析以及使用随手可得。目前,Footprint 从 22 条公链上收集、解析和清理数据,把无语义以及无序的链上数据,转化成让用户能使用无代码拖放界面、SQL等多种形式构建图表以及仪表盘。除了提供链上原始数据,Footprint 根据业务逻辑抽象出具有业务逻辑的流水数据,既能实现快速生产数据,也能方便分析师在此数据的基础上,快速计算自己需要的业务指标。而这也适用于开发者使用。
Footprint Analytics
2023/01/18
7420
Web3 的开发者,如何评估以及选择调用链上数据的解决方案
在线打开CAD或Solidworks的STP文件,通过以图搜图与实物比对搜索
机械制造与加工行业中,设计图纸与实物的比对是确保产品质量的关键步骤。然而,传统比对方式费时费力、准确性难以保障。大模型技术推出智能比对系统,整合以图搜图、多视图生成和实物比对功能,帮助企业在产品设计、生产和质量控制环节实现高效、精准的自动化比对。
思通数科
2024/11/29
4001
在线打开CAD或Solidworks的STP文件,通过以图搜图与实物比对搜索
如何快速开发数字孪生可视化应用?
如何快速高效开发可视化应用?开发可视化应用可选择的方式有很多,然而研究这些对于初学者来讲,尤其是没有web开发基础的人员是痛苦的。
thingjs
2021/12/17
1.1K0
如何快速开发数字孪生可视化应用?
Lottie在手,动画我有:ios/Android/Web三端复杂帧动画解决方案
本文编辑于OS X系统,之前出现过windows下看不到部分图片的情况,如有请大家告知
啦啦啦321
2019/09/29
3.8K0
Lottie在手,动画我有:ios/Android/Web三端复杂帧动画解决方案
webgl图库研究(包括BabylonJS、Threejs、LayaboxJS、SceneJS、ThingJS等框架的特性、适用范围、支持格式、优缺点、相关网址)
为实现企业80%以上的生产数据进行智能转化,在烟草、造纸、能源、电力、机床、化肥等行业,赢得领袖企业青睐,助力企业构建AI赋能中心,实现智能化转型升级。“远舢文龙数据处理平台”以AI驱动,构建5G时代下企业数智基础,从根本上改变了数据采集、存储和使用的方式,是当下企业构建数字化与智能化能力的首选产品。“远舢知识图谱平台”,作为国内第一批落地应用的“知识图谱”,平均缩短智能化应用开发周期70%,延长企业分析决策应用生命周期150%。“远舢Hybrid Twin”构建面向未来智能工厂全场景的全息交互模式,实现物理空间与数字空间的混合孪生。为国产工业AI新锐,以远舢工业云平台为核心,以AI驱动的方式,打造一个用户可以自研APP的智能云平台,变革未来企业IT消费模式,输送企业转型升级动能,为企业创造可量化价值。我们在这领域展示出来的强大产品竞争力,以及公司团队深耕制造、脚踏实地、坚持打造极致产品的理念,持续提供增值服务,我们期待和坚信远舢公司能成为未来企业级人工智能领域的独角兽! 本文为选择合适的webGl框架,为后续项目奠定基础;避免盲目选择框架,导致后续项目重构带来不必要的成本浪费。本文清楚的讲述了各个框架的特点,适用范围,优缺点以及相关网址范例;以便于后续更快速的开发,提高生产效率,最后进行总结。
acoolgiser
2020/11/12
5.5K0
猿大师中间件:前端网页调用内嵌本机EXE、OCX控件、ActiveX控件或桌面应用程序神器
猿大师中间件自从2019年发布以来,迄今为止不断迭代升级,给第三方提供了将自己的桌面程序和OCX控件支持直接内嵌到浏览器网页运行的赋能SDK开发包。
李不白
2025/02/21
1680
猿大师中间件:前端网页调用内嵌本机EXE、OCX控件、ActiveX控件或桌面应用程序神器
最火移动端跨平台方案盘点:React Native、weex、Flutter
跨平台一直是老生常谈的话题,cordova、ionic、react-native、weex、kotlin-native、flutter等跨平台框架的百花齐放,颇有一股推倒原生开发者的势头。
JackJiang
2018/08/13
7.6K0
最火移动端跨平台方案盘点:React Native、weex、Flutter
ODA(Open Design Alliance)介绍「建议收藏」
注:与autocad兼容的软件,大部分基于Intellicad,另外刚冒出一个bricscad,天河的PCCAD V10就是基于bricscad,bricscad是用ODA的库开发的,而开发bricscad的公司原来是ITC的成员,而Intellicad也是ODA的成员,现在正用ODA的库重写Intelicad。ODA是由Intellicad的老东家visio牵头成立的…这关系够乱的。
全栈程序员站长
2022/09/20
5.9K0
网络工程师最常用的7款利器,超专业超有用!
作为一个网络工程师,在日常工作中肯定会使用许多方便的实用软件来提高效率,下面就简单介绍一下网络工程师常用的7种软件,不要错过哦!
释然IT杂谈
2020/12/08
1.7K0
网络工程师最常用的7款利器,超专业超有用!
端侧安全的主流解决方案是什么?
我国网络技术水平的提升,带动着WEB前端业务量的显著增长,人们对于网络服务的需求也日益复杂,与此同时,越来越多的黑客出现,其攻击水平也有了明显提升,WEB前端也成为了众多黑客进行网络攻击的主要目标。
二山山记
2022/11/17
5660
端侧安全的主流解决方案是什么?
这几个人脸识别解决方案你用过没?
以上就是完成人脸识别所需的步骤,如果你想在这个基础上,做人脸比对或者身份证校验等拓展功能,可以借助用户的身份证、姓名等信息,再结合第三方的AI服务,比如腾讯云的人脸核身来完成,本质上底层数据支持来自公安的实名认证接口
树酱
2022/03/09
1.6K0
这几个人脸识别解决方案你用过没?
推荐阅读
相关推荐
网页编辑DWG框架搭建快速入门(WEB CAD SDK)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档