Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >大数据扫黄,是怎样发现你的?

大数据扫黄,是怎样发现你的?

作者头像
数据森麟
发布于 2022-10-31 07:58:48
发布于 2022-10-31 07:58:48
76500
代码可运行
举报
文章被收录于专栏:数据森麟数据森麟
运行总次数:0
代码可运行

扩展阅读

在诸多审查工具中,“AI 鉴黄”是最新也最高效的一种。

简单来说,“AI 鉴黄”就是通过深度神经网络,按照各种描述特征来提取图像中的关键点,比如是否出现皮肤裸露等等,将色情图片与正常图片进行分类。

读到这里,大家可能会发现,“AI 鉴黄”还存在一些严峻的挑战,比如:

1.色情图像和正常图像有很多相似之处,判断非常复杂。游泳、比基尼等图片中同样也有大量裸露皮肤,被错误地归类为色情并删除,很可能影响用户网上冲浪的体验。

2.判断色情的标准不同。法官斯图尔特曾有句名言,我无法定义色情,但当我看到它时,我就知道了。对色情内容的监测也有一定的主观性,AI 往往会根据特征对裸露身体的大卫塑像而“痛下杀手”,却对部分软色情轻松放过。

3.依赖训练数据带来的风险。那么,是不是给 AI 尽可能多地语料就能帮助它提升识别的准确率呢?答案也不行。基于深度学习的黑箱性,攻击者如果知道 AI 鉴黄是根据哪些数据训练出来的,就可以有针对性地攻击、对抗这个模型,使其很快失效。

这也是为什么,人工鉴黄师,即人类审查员,依然还需要兢兢业业地在岗位上为冲浪护航。

End

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。

管理员二维码:
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-08-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据森麟 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大数据扫黄,是怎样发现你的?
来源:163.com/dy/article/HF5UJGGH05319928.html 尾 扩展阅读 在诸多审查工具中,“AI 鉴黄”是最新也最高效的一种。 简单来说,“AI 鉴黄”就是通过深度神经网络,按照各种描述特征来提取图像中的关键点,比如是否出现皮肤裸露等等,将色情图片与正常图片进行分类。 读到这里,大家可能会发现,“AI 鉴黄”还存在一些严峻的挑战,比如: 1.色情图像和正常图像有很多相似之处,判断非常复杂。游泳、比基尼等图片中同样也有大量裸露皮肤,被错误地归类为色情并删除,很可能影响
程序猿DD
2022/09/13
5590
大数据扫黄,是怎样发现你的?
性感与色情有多远——你不知道的图片鉴黄那些事儿
图片鉴黄服务市场容量巨大,作为移动互联网行业最为热门的创业领域,移动社交类App每天生产大量图片,并有无数色情图片混杂其中,所以高效准确地鉴别和剔除淫秽色情信息成为一项十分艰巨的任务。 此外,移动直播的大热也导致图片鉴黄需求大增,尤其对于中小开发团队而言,直播平台很可能因为人力监管问题而在涉黄审核方面出现风险。而自主研发鉴黄功能或增加审核人员又会增加产品和服务外的支出,给前期开发造成额外压力。利用人工智能图像识别技术进行高效准确的自动化鉴黄服务,能降低企业使用鉴黄服务的技术门槛,帮助企业有效减少相关人力成
神无月
2018/06/25
3K0
深入理解Python函数的9个黄金法则
实现__call__协议后,plus_3对象便成为函数,可以plus_3(4)了!强大。
数据森麟
2021/10/22
3910
深入理解Python函数的9个黄金法则
利用人工智能检测色情图片
色情内容在中国一直处于严格的监管,即使这样,互联网上还是很容易就能访问到色情内容。还记得曾经的“绿坝-花季护航”软件么?由于其识别效果差、软件不稳定,最后不了了之,浪费了大量的人力和金钱。
云水木石
2019/07/02
3.3K1
利用人工智能检测色情图片
Python自动化操作Excel绘制条形图!
有人提议用vba,但是不得不说,没有学过vba的朋友,会觉得vba用起来很困难。那还不容易,直接上Python,没有什么问题是Python解决不了的。
数据森麟
2022/10/31
5370
Python自动化操作Excel绘制条形图!
出行必备:手机1秒调出健康码 !
当前的疫情形势依然严峻,无论是上班上学去医院, 还是出门购物等,进出多数场合都需要出示健康码,可每次出示都要操作一番手机,偶尔还可能遭遇“短暂失忆突然找不到健康码入口、网速极差加载需要半天时间”等情形,尤其是别人在身后排队等着你找健康码时,别提多尴尬。其实无论是安卓还是iPhone,都可以快速调出健康码。
数据森麟
2022/10/31
8380
出行必备:手机1秒调出健康码 !
Python人工智能鉴黄师的自我修养
專 欄 ❈LucasX,Python中文社区专栏作者。 ❈ 前阵子在设计一个智能黄反识别的方案,查阅了已有Paper,结合自己的一点想法,现对不良图像的识别进行以下梳理: 方案1:皮肤区域检测法 与
Python中文社区
2018/02/01
1.8K0
Python人工智能鉴黄师的自我修养
在阿里“解放”鉴黄师是一种怎样的体验
2009 年,主要从事数字信号和图像处理研究、博士刚刚毕业的薛晖拿到了阿里巴巴的 offer,那一年淘宝的全年交易额已经达到 2083 亿元,薛晖激动地搓搓小手,阿里巴巴的网站上有大量未被挖掘利用的数据,比如照片、视频、语音以及非结构化的文本,如果能让机器做到看清和读懂这些信息,一定是一件非常有意义和有价值的事。
昱良
2019/05/14
1.7K0
在阿里“解放”鉴黄师是一种怎样的体验
英国开始试验一周工作四天!不减薪!
据天空新闻台报道,从6月6日起,全英大量公司企业将在不减少薪资待遇的前提下,开始“一周四天”的工作模式。
数据森麟
2022/10/31
2590
英国开始试验一周工作四天!不减薪!
近亿级数据集下线,MIT道歉,ImageNet 亦或遭殃
麻省理工学院(MIT)已永久删除包含8000万张图像的Tiny Images数据集。
AI科技评论
2020/07/03
6330
AI色情被大平台驱逐后,这帮人搞了一个小社群,一心一意分享AI色情作品,精进技术
大数据文摘出品 年初的时候,由初创公司Stability AI开发的根据文本生成图像的AI程序开源了,最近这样的小程序在国内也很火。 不过,这个功能很显然会走歪——很快有人开始用这个AI生成色情图片。 比如,Reddit 和 4chan 上的社区用户开始利用该AI生成真实和动画风格的裸体人物图像,其中大部分是女性,以及名人的换脸裸体图像。 很快,这些社区发现了这一问题,Reddit 迅速关闭了许多致力于人工智能色情的子版块,甚至允许一些色情内容的 NewGrounds 也完全禁止人工智能生成的艺术作品。 在
大数据文摘
2023/04/10
3.2K0
AI色情被大平台驱逐后,这帮人搞了一个小社群,一心一意分享AI色情作品,精进技术
揭秘美国“鉴黄师”:做这份工作到底是什么样的体验?
“人工智能“鉴黄师已经在路上…… 在全球范围内,有各种各样的奇葩工作,例如试睡员、套套试用员、小鸡性别鉴定师以及鉴黄师等,在这些奇葩的工作中,在很多人看来,鉴黄师已经是一份很不错的工作,天天都欣赏不同爱情作动片,还能有一份不错收入,轻轻松松过完一天。 这份看起来很轻松的工作,但实际上却一点也不轻松,因为长时间对着电脑屏幕对眼睛和颈椎都不好,久坐对腰椎也不好,但这些都不重要,重要的是这些内容对鉴黄师的摧残也是很大的。 美国《华尔街日报》网站近日发表文章称,Facebook、YouTube等硅谷巨头雇佣了大批外
企鹅号小编
2018/01/12
3.3K0
揭秘美国“鉴黄师”:做这份工作到底是什么样的体验?
原来鉴黄师的KPI是这样的
欣赏人体艺术的精神需求,以及教育未成年人的现实需求,如何统一这两者,就成了一个亟待解决的问题。
量子位
2021/06/17
1.7K0
我常用的15个数据源网站
前面介绍过实用的效率小工具,真的帮了我很多忙,这次给小伙伴们再种草一些数据源网站。
数据森麟
2022/10/31
1.6K0
我常用的15个数据源网站
一款「 负体验 」的AI产品
今年我大部分的时间都花在研究人工智能和写书上(文章后面有书的进展,出版社编辑终于可以让我公布出来了哈哈哈),在快要到10月份的时候,我大学毕业时立下的“一年开发一个产品”目标还没开始实现,我觉得不能再这样拖下去了,于是开始构思今年要做什么。
mixlab
2018/12/29
5520
从Python可视化图表中探究王心凌出圈的流量密码
疫情当下,“刘畊宏女孩”的余热尚在,“王心凌男孩”则是开始刷屏于各大社交媒体的头版头条。从上周五《乘风破浪的姐姐》第三季初舞台播出至今,王心凌的热度持续升温,一天上十几个热搜不在话下,在节目中,凭借着重唱一首自己的经典歌曲《爱你》,再配以当年经典的可爱舞蹈,瞬间点燃全场的热情,也将屏幕前的网友带回了二十年前的青春,那么今天小编就用Python数据分析一下王心凌爆火出圈的原因吧!
数据森麟
2022/10/31
4700
从Python可视化图表中探究王心凌出圈的流量密码
pandas中apply与map的异同
pandas作为数据处理与分析的利器,它的江湖地位非同小可。在我们数据处理与分析过程中,有时候需要对某一列的每一个值都进行处理,这时候推荐大家使用apply或者map。
数据森麟
2020/10/27
7300
苹果扫描iPhone所有照片,发现问题还要报警:全新「保护」计划惹众怒
机器之心报道 机器之心编辑部 这种叫做 neuralMatch 的系统将会实时扫描你手机里的所有照片,传上云端进行比对。如有非法则联系执法部门。 众所周知,iPhone 虽然贵但很好用。人们选择 iPhone 的一大理由就是信息安全:不论是手机上物理存在的「安全飞地」,还是苹果公司面对 FBI 解锁嫌犯手机需求宁愿打官司也不从的态度,这家公司对于个人隐私的保护一直为人称道。 然而就在最近,苹果突然改变态度的消息传出,让人大为惊讶。 《金融时报》等媒体爆出,苹果计划扫描所有存储在 iPhone 和 iClo
机器之心
2023/03/29
3760
苹果扫描iPhone所有照片,发现问题还要报警:全新「保护」计划惹众怒
内容量大增,带来的安全挑战应如何应对?
首先是每个直播平台都有响应的规范规范,比如禁止低俗、性暗示的行为。禁止男性赤裸上身,同时展示和露出纹身也不允许,所以今天大家只能看到把双手裸露出来,看不到我胸前的HelloKitty哈。
腾讯云开发者
2020/03/31
1.5K0
我在新加坡寻找“红灯区”,AI 老司机翻了个白眼
这是一个真实的故事。前几天,我和一群小伙伴在新加坡参加了一场神秘的黑客大会,具体是什么大会,以后再说。我先说说你们感兴趣的“寻找红灯区事件”。
刀刀老高
2019/03/06
1K0
我在新加坡寻找“红灯区”,AI 老司机翻了个白眼
推荐阅读
相关推荐
大数据扫黄,是怎样发现你的?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验