Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >那些打着AI万金油旗号的产品欺骗大众,如何识别?

那些打着AI万金油旗号的产品欺骗大众,如何识别?

作者头像
AI科技大本营
发布于 2019-12-11 09:22:27
发布于 2019-12-11 09:22:27
4470
举报

作者 | Arvind Narayanan

译者 | 刘畅

出品 | AI科技大本营(ID:rgznai100)

如今,很多打着AI名号售出的产品都属于万金油系列,没什么实质性的功能。为什么会这样?我们应该如何识别这类AI?

幻灯片上是评估性格和工作合适性的30秒视频

数以百万计的求职者已经接受了这类算法的评估。上图是来自某家公司的促销视频截图。这些系统声称甚至不用理会应聘者说的内容,根据肢体语言和语音就可以分析一个应聘者。

基本常识会告诉我们这不可能,但是AI专家会说这是可能的。而实际上这个产品只是一个精心制作的随机数生成器。

这些公司筹集了数亿美元,并且积极的占领客户。伪造AI来筛选求职者的现象变得越来越严重。这张PPT显示了该问题有多严重,其中的表格来自https://arxiv.org/abs/1906.09208

人们正在学习如何利用这些虚假系统来工作,并在社交媒体上分享一些恐怖的故事

这为什么会发生?为什么人事部门如此容易受欺骗?除了雇佣,其它哪些领域还有打着AI旗号的万金油工具?

以上是作者的关于为什么有如此多的AI万金油工具,以及为什么决策者会被它们欺骗的假设。

例如,AlphaGo是一项非凡的成就,并且值得称赞。大多数专家都没想到这种可能。

但是,它与声称可以预测工作绩效的工具之间,却大相径庭。

媒体大肆宣传公司可以将AI作为解决所有问题的解决方案。因此,美国公众认为,所有工种的自动化仅10年之遥!

如果决策者认为这种根本性变革即将到来,请想象一下它将如何扭曲我们正在进行的优先事项。我相信在如今社会这实际上是正在发生的。

请注意,AI专家对人工智能或强AI的预测距离尚有50多年之久,但是历史告诉我们,即使是专家,也往往对AI的发展太乐观了。

让我们更具体一点。我将把AI应用程序分为三类(并非详尽无遗)。

这张幻灯片上的所有内容都是一个识别问题(Deepfakes并不是纯粹的识别而是紧密相关的。它们是使用生成对抗网络来实现的)。识别是人工智能快速发展的几个领域之一。

在这张幻灯片上的所有任务中,AI都已经达到或超过了人类的准确性,并且正在不断迅速提高。

取得进展的根本原因是,这些任务没有不确定性或模棱两可。给定两张图像,关于它们是否代表同一个人是有一个基本事实。因此,如果有足够的数据和计算能力,人工智能能够学到将一张脸与另一张脸区分开的模式。人脸识别存在一些明显的失败,但是我很高兴地预测它将能变得更加准确(不过这也正是我们应该担心的原因)。

第二类是关于尝试自主判别的应用程序。人的思维是具有启发性的,例如什么是垃圾邮件,而不是垃圾邮件,并且给出足够的例子。机器会尝试去学习它。

在这些任务上,人工智能将永远是不完美的,因为它们涉及判别力,并且理性的人可能会不同意正确的决定。

我们似乎已经准备部署这些系统,并且必须决定如何最好地管理它们,例如为被错删内容的人们找出适当的程序机制。

我将把剩下的话题集中在第三类,那里有大量的万金油。

上面已经展示了声称可以预测工作适合程度的工具。类似的,基于惯犯的算法来预测保释金的多少。人们使用算法去分析社交媒体帖子并预测恐怖分子的危险程度,因而被拒之门外。

这些问题很难解决,因为我们无法预测未来。而这些应该是常识。但在涉及AI时,我们似乎已经决定忘记常识。

当然,这甚至与AI所面向的事物(如机器人技术)都不相近。但,要点是说明对于不同类型的任务,数据的数量和质量对精度的限制上是如何不同的。

接下来将展示,无论你投入多少数据,第三类应用不会有真正的改善。

我知道这是一次衡量社会结果可预测性,非常严格的尝试。

他们根据深入访谈和多年来多次重复进行的家庭观察收集了有关每个孩子和家庭的大量数据。

他们使用了与许多其他机器学习竞赛相似的挑战环境。

任务是根据训练实例学习背景数据和结果数据之间的关系。比赛期间在排行榜上评估准确性,比赛结束后根据保留的数据评估准确性。

完美预测对应于R^2为1。预测每个实例的均值对应于R^2为0(即,该模型完全没有学会区分实例)。

大多数人的直觉似乎都认为R^2的值在0.5到0.8之间。并且组织竞赛的许多专家都寄予厚望。

这是实际发生的情况。

记住:数百名AI / ML研究人员和学生尝试过这样做,他们需要最大限度地提高预测准确性,每个家庭都有13,000个特征。图上的是表现最好的模型。

这就是问题所在。

回归分析已有一百年历史了。

在许多领域都有相同的发现。

请注意,上图所示是准确度,而不是R^2,因此65%仅比随机数略好。

实际准确性可能更低,这是因为虽然该工具声称可以预测累犯,但实际上是能预测重新逮捕,因为这就是数据中记录的内容。因此,至少算法的某些预测性能来自预测策略的偏差。

这是个人的意见。当然,如果发现相反的证据,我愿意改变主意。但是,鉴于目前的证据,这似乎是最谨慎的看法。

驾照的欠费可以被视为预测事故风险的一种方式。一些研究发现此类系统可以进行合理的使用。

很长时间以来,我们就知道,如果我们真正想做的只是预测,那么简单的公式比人类的预测更准确, 甚至是经过多年训练的专家。丹尼尔·卡尼曼(Daniel Kahneman)解释说,这是因为人类的预测往往“太多杂念”:如果输入相同,则不同的人(甚至在同一时间的同一个人)将做出非常不同的预测。而使用统计公式则可以消除这种不同。

与人工评分规则相比,使用AI进行预测有许多缺点。也许最重要的是缺乏可解释性。想象一下这样一个系统,在该系统中,每次您被警务人员拦下时,警务人员都会将您的数据输入计算机,这并不像驾照上的积分。大多数情况下,您可以免费离开,但是在某些时候,黑匣子系统会告诉您不再允许被开车。

不幸的是,实际上如今我们在许多领域都拥有这种系统。

来源:

https://www.cs.princeton.edu/~arvindn/talks/MIT-STS-AI-snakeoil.pdf

(*本文为AI科技大本营编译文章)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI不是万灵神药!看看普林斯顿大学的这份“假AI防骗报告”
AI不是万灵药,但越来越多的人把它说成是万灵药,在这些人的鼓吹下,更多的人可能真的会把AI当成万灵药。
CDA数据分析师
2019/11/22
5680
AI看人:如何用人工情感智能识别求职者的性格?
算法可用于评估求职者的情感和性格特征,帮助雇主找到合适人选,但它在克服人类偏见的同时也会造成隐私问题。 人脸识别技术能让我们支付午餐费、解锁手机——它甚至能把我们送进监狱。现在,这项技术还在不断发展:
WZEARW
2018/04/16
1.2K0
AI看人:如何用人工情感智能识别求职者的性格?
RLHF不是万金油!MIT哈佛等32人研究天团揭露最大弱点,囊括250+论文成果,挑战大模型机制
当前,不论是GPT-4,还是Llama 2等大语言模型,背后的机制都是人类反馈强化学习(RLHF)。
新智元
2023/08/07
3350
RLHF不是万金油!MIT哈佛等32人研究天团揭露最大弱点,囊括250+论文成果,挑战大模型机制
中芯国际上市暴涨245%,原来芯片制造才是真正的万金油生意
开盘伊始,中芯国际的股价暴涨到95元,涨幅245.96%,仅仅90分钟就有超360亿元资金成交,成科创板名副其实的“吸金王”。
科技云报道
2022/04/16
5270
中芯国际上市暴涨245%,原来芯片制造才是真正的万金油生意
谷歌AI医疗新成果:将转移性乳腺癌检测准确率推向了几乎完美的99%
在国家癌症中心发布的《2017年中国肿瘤的现状和趋势》报告中显示,乳腺癌的发病率已经位列女性恶性肿瘤之首。
镁客网
2018/10/18
6040
2019年AI年度主题:公众对面部识别更加警惕,反对浪潮汹涌
近日,纽约大学AI Now Institute 第四届年度AI Now研讨会在纽约大学举办,AI Now联合创始人凯特·克劳福德(Kate Crawford)和梅雷迪斯·惠特克(Meredith Whittaker)进行了简短的演讲,总结了一年来的关键时刻,并着重讨论了五个主题:
新智元
2019/10/15
5470
2019年AI年度主题:公众对面部识别更加警惕,反对浪潮汹涌
全国首个无人警局在武汉推出,腾讯AI加持,全年7*24小时刷脸办证
李根 发自 成都街头 量子位 报道 | 公众号 QbitAI 全国首个AI加持的无人警局,即将成为现实。 可全年7*24小时办理新车注册登记,可直接刷脸参与驾照科目一考试,还可以在模拟设备上模拟驾驶安全学习…… 这一次,武汉走在了最前头。 无人警局 在今日“武汉交警政务服务迈入 AI 时代”的发布会上,腾讯与武汉市公安局交通管理局宣称,将携手打造全国第一个无人警局,不久将来就能投入使用。 此前武汉交警已与腾讯有智慧服务平台方面的合作,以此为基础,利用AI技术可以进一步实现“无人警局”,24小时不打烊,全年
量子位
2018/03/23
1.2K0
人脸识别登上Nature封面!看脸的世界,AI却心怀偏见
威廉姆斯正在密歇根州底特律的家中,一通电话打进来:我们是警察局的,已经掌握了你盗窃的事实,你可以投案自首。
新智元
2020/11/24
4870
AI 安防人脸识别落地的冰火两重天
一项技术的研发、落地,通常在同一象限内基本能让全球的从业者达成初步共识,譬如5G、IoT等等。
AI掘金志
2019/08/29
1K0
AI 安防人脸识别落地的冰火两重天
不“丢脸”实现人脸识别,使用TiFGAN合成音频 | AI Scholar Weekly
呜啦啦啦啦啦啦啦大家好,还记得那位在中国向工程师们教授AI的美国老师Christopher Dossman吗?大数据文摘与他取得了联系,并且有幸邀请他开设了专栏。从本周起,由Chris精心打造的AI Scholar Weekly栏目终于要和大家见面了。
大数据文摘
2019/03/06
9430
不“丢脸”实现人脸识别,使用TiFGAN合成音频 | AI Scholar Weekly
对不起,AI觉得你有虐童倾向,求职失败
最近,一个叫Predictim的AI评估系统被用于保姆招聘上,它能在线预测保姆的性格,并能给出不良性格因素的出现概率。孩爸孩妈的心腹大患,这下可以被一键避免了。
量子位
2018/12/19
4770
对不起,AI觉得你有虐童倾向,求职失败
Science:2030年,或将改变生活的5项人工智能技术
◆ ◆ ◆ 导读 人工智能通过模拟人的思维、意识的信息过程,独立完成具体指令,它使得计算机得以完成只有人才能进行的工作,被誉为二十一世纪三大顶尖技术之一(基因工程、纳米科学)。从人脸识别、语音助手到机器人,人工智能技术正逐渐融入现代化生活。2030年,会有哪些人工智能应用将与我们息息相关呢? 人工智能(AI)是计算机学科的分支,通过模拟情景、人的意识和思维独立完成具体指令。AI涉及的领域包括机器人、语言识别、图像识别、专家系统等等,它已经逐渐融入现代生活,并为其添姿增彩,最典型的例子包括苹果的Siri(智能
大数据文摘
2018/05/24
4650
AI能拯救陷入泥沼的互联网招聘吗?
本文主要探讨了AI技术在互联网招聘中的应用以及带来的影响。传统的招聘平台主要依赖人工筛选简历,效率低下且容易出错。而AI技术可以通过对大量简历进行智能分析,快速匹配求职者与招聘职位,提高招聘效率。同时,AI技术还可以应用于面试环节,实现远程自动面试。尽管AI技术在招聘行业具有巨大潜力,但同时也面临着一些挑战,如信息审核困难、难以替代人工面试等。
企鹅号小编
2018/01/03
9030
AI能拯救陷入泥沼的互联网招聘吗?
谷歌AI在转移性乳腺癌检测中准确率达到99%
转移性肿瘤,即癌细胞脱离其原始组织,通过循环或淋巴系统穿过身体,并在身体的其他部位形成新的肿瘤,很难检测。2009年在波士顿两家医疗中心对102名乳腺癌患者进行的一项研究发现,四分之一的患者受到护理过程失败的影响,例如身体检查不充分和诊断检查不完整。
AiTechYun
2018/10/25
4440
谷歌AI在转移性乳腺癌检测中准确率达到99%
人工智能安全:是营销炒作还是全新机会
作者 | Mark Horvath 译者 | 人人云图(AoGraph):杨鹏,曹靖 出品 | 人工智能头条(公众号ID:AI_Thinker) 本文来自Gartner分析报告,原标题:Artificial Intelligence and Application Security Vendors: Marketing Hype or Genuine Hope在今天,企业的安全和风险负责人需要判断在研发、运维以及应用程序安全测试中使用人工智能或机器学习是否具有实际价值。他们必须能够意识到应用人工智能和机
用户1737318
2018/06/05
6740
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
研究者Cameron R.Jones招募了500名志愿者,他们被分为5个角色:4个评估员,分别是GPT-4、GPT-3.5、ELIZA和人类,另一个角色就「扮演」人类自己,藏在屏幕另一端,等待着评估员的发现。
新智元
2024/05/22
2400
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
30分钟获取50万数据点!无接触招聘季,准备好迎接AI面试官的暴击了吗?
想象一下,你面对的不再是面试官,而是一个能够抓取你所有“微表情”的人工智能,它可以从你的一颦一笑中分析出你的性格、情绪、动机等心理状态,甚至是跳槽概率。
大数据文摘
2020/03/05
6090
30分钟获取50万数据点!无接触招聘季,准备好迎接AI面试官的暴击了吗?
人工智能帮助医生将癌症诊断准确率提升至99.5%
2016年6月16日,美国Newswise新闻网站(www.newswise.com)发布消息称,人工智能可以帮助医生将癌症的诊断准确率提升至99.5%。 病理学家们仍然在沿用过去使用了100年的方式来诊断疾病,即手动检查显微镜下的图像。但新的工作表明,计算机可以帮助医生提高检测的准确性,并极大地改变癌症和其他疾病的诊断方法。 贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center,BIDMC)的一个研究小组和哈佛医学院(HMS)最近开发了一个人工智能(AI)系统
人工智能快报
2018/03/07
1.1K0
DNSPod十问秦勇:为什么医疗AI最爱眼科?
秦勇,鹰瞳科技(Airdoc)COO,中国人工智能学会智慧医疗专委会委员,长期从事医疗人工智能方向的工作,拥有丰厚的项目经验、管理经验和技术积累,参与多个医院人工智能应用基地的建设项目,对人工智能在医学特别是眼科领域的应用有深入的研究,在核心期刊发表高水平论文十余篇。2021年11月5日,鹰瞳科技在香港联交所主板上市,被誉为“医疗AI第一股”。
腾讯云DNSPod团队
2023/08/03
3800
DNSPod十问秦勇:为什么医疗AI最爱眼科?
Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了(全文+视频)
本周五,OpenAI 的前首席科学家 Ilya Sutskever 在全球 AI 顶会上表示:「我们能获得的数据已经到头,不会再有更多了。」
机器之心
2025/02/14
840
Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了(全文+视频)
推荐阅读
AI不是万灵神药!看看普林斯顿大学的这份“假AI防骗报告”
5680
AI看人:如何用人工情感智能识别求职者的性格?
1.2K0
RLHF不是万金油!MIT哈佛等32人研究天团揭露最大弱点,囊括250+论文成果,挑战大模型机制
3350
中芯国际上市暴涨245%,原来芯片制造才是真正的万金油生意
5270
谷歌AI医疗新成果:将转移性乳腺癌检测准确率推向了几乎完美的99%
6040
2019年AI年度主题:公众对面部识别更加警惕,反对浪潮汹涌
5470
全国首个无人警局在武汉推出,腾讯AI加持,全年7*24小时刷脸办证
1.2K0
人脸识别登上Nature封面!看脸的世界,AI却心怀偏见
4870
AI 安防人脸识别落地的冰火两重天
1K0
不“丢脸”实现人脸识别,使用TiFGAN合成音频 | AI Scholar Weekly
9430
对不起,AI觉得你有虐童倾向,求职失败
4770
Science:2030年,或将改变生活的5项人工智能技术
4650
AI能拯救陷入泥沼的互联网招聘吗?
9030
谷歌AI在转移性乳腺癌检测中准确率达到99%
4440
人工智能安全:是营销炒作还是全新机会
6740
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
2400
30分钟获取50万数据点!无接触招聘季,准备好迎接AI面试官的暴击了吗?
6090
人工智能帮助医生将癌症诊断准确率提升至99.5%
1.1K0
DNSPod十问秦勇:为什么医疗AI最爱眼科?
3800
Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了(全文+视频)
840
相关推荐
AI不是万灵神药!看看普林斯顿大学的这份“假AI防骗报告”
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档