Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >中国爬虫生存指南:违法违规案例汇总!

中国爬虫生存指南:违法违规案例汇总!

作者头像
良月柒
发布于 2019-12-02 08:30:28
发布于 2019-12-02 08:30:28
2.3K0
举报

阅读本文大概需要 4 分钟。

来自:知乎

最近在 GitHub 发现了一个爬虫库,这个库整理了所有中国大陆爬虫开发者涉诉与违规相关的新闻、资料与法律法规

对于很多爬虫从业者,往往很多时候不知道爬虫的违法边界在哪。并且最近出现了很多做爬虫被抓的新闻,导致这个行业现在人心慌慌。

这篇文章不是说做爬虫有多么危险,也不是什么爬虫劝退文,只是想说通过这些真实的违规案例,让大家对在使用爬虫的时心存敬畏,合规合法的去使用。

GitHub 地址:

https://github.com/HiddenStrawberry/Crawler_Illegal_Cases_In_China

该库也是如此,它的初衷是为了帮助在中国大陆工作的爬虫行业从业者了解我国相关法律,避免触碰数据合规红线。这个库应该是学爬虫,人人必学的爬虫生存指南。

目前收纳了违法爬虫四类共 9 个项目:

爬虫禁区1:为违法违规组织提供爬虫相关服务(验证码识别服务贩卖、SEO……)

CASE1:知乎某极验破解者自述被抓(已删除) 链接:

https://github.com/HiddenStrawberry/Crawler_Illegal_Cases_In_China/tree/master/case1

知乎部分内容.png

CASE2:“快啊答题”AI破解验证码服务开发者被判刑

CASE9:永嘉警方揪出“黑”百度黑客团伙 干扰搜索引擎牟利超七千万元

爬虫禁区2:个人隐私数据抓取与贩卖

CASE3:简历大数据公司“巧达科技”被一锅端

CASE4:社保掌上通被下架 用户的信息很容易泄露太不安全了

CASE5:爬虫为何受关注?业内:大数据服务商或因合作方涉套路贷犯罪而被牵连

爬虫禁区3:利用无版权的商业数据获利

CASE6:“车来了”涉嫌偷数据被警方立案

CASE8:裁判文书网数据竟被售卖:爬虫程序抓取 或成侵权

爬虫禁区4

CASE7:头疼大战前传:头条前高管反噬被判刑

知道了爬虫的禁区,还十分有必要了解以下相关法律介绍。

非法获取计算机系统数据罪

根据《中华人民共和国刑法》第二百八十五条规定,非法获取计算机信息系统数据、非法控制计算机信息系统罪,是指违反国家规定,侵入国家事务、国防建设、尖端科学技术领域以外的计算机信息系统或者采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据,情节严重的行为。刑法第285条第2款明确规定,犯本罪的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。

侵犯商业秘密罪

《反不正当竞争法》第九条,以不正当手段获取他人商业秘密的行为即已经构成侵犯商业秘密。而后续如果进一步利用,或者公开该等信息,则构成对他人商业秘密的披露和使用,同样构成对权利人的商业秘密的侵犯。

非法侵入计算机信息系统罪

《刑法》第二百八十六条还规定,违反国家规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,后果严重的,构成犯罪,处五年以下有期徒刑或者拘役;后果特别严重的,处五年以上有期徒刑。而违反国家规定,对计算机信息系统中存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作,后果严重的,也构成犯罪,依照前款的规定处罚。

网络安全法

网络安全法》第四十四条 任何个人和组织不得窃取或者以其他非法方式获取个人信息。因此,如果爬虫在未经用户同意的情况下大量抓取用户的个人信息,则有可能构成非法收集个人信息的违法行为。

民法总则

《民法总则》第111条任何组织和个人需要获取他人个人信息的,应当依法取得并确保信息安全。不得非法收集、使用、加工、传输他人个人信息

侵犯公民个人信息罪

《刑法》修正案(九)中将刑法第二百五十三条进行了修订,明确规定违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,构成犯罪;在未经用户许可的情况下,非法获取用户的个人信息,情节严重的也将构成“侵犯公民个人信息罪”。根据《最高人民法院 最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第五条规定,对“情节严重”的解释,(1)非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上的;(2)非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上的;(3)非法获取、出售或者提供第三项、第四项规定以外的公民个人信息五千条以上的便构成“侵犯公民个人信息罪”所要求的“情节严重”。

专业律师发表的相关观点

周 浩:利用网络爬虫获取数据的刑事责任分析

金 杜:数据之争:网络爬虫涉及的法律问题

这篇文章值得转发给你身边在做在学习爬虫的人看。

<END>

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序员的成长之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
中国爬虫违法违规案例汇总!
最近在 GitHub 发现了一个爬虫库,这个库整理了所有中国大陆爬虫开发者涉诉与违规相关的新闻、资料与法律法规。
龙哥
2019/11/27
1.6K0
爬虫入门到放弃04:爬虫=犯罪?对不起,我对钱没有兴趣!
我们身处大数据时代,数据趋于透明化、公开化,我们是否就可以拿着数据为所欲为?几年前很多人向往着"车厘子自由",同样在也有很多人也追求着技术自由。时至今日,我们可以在合法的范围内自由应用技术,那么对于爬虫的合法化,到底有哪些的法律可以来界定?
叫我阿柒啊
2021/06/10
7010
网络爬虫法律条文或出台:你的程序合法吗?
2018年10月20日,一篇《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章一出世便走红网络。文中称百亿体量的马蜂窝,其中2100万条“真实点评”中有1800万条是通过机器人从大众点评和携程等竞争对手抄袭而来。通过语义分析、数据挖掘,发现了7454个抄袭账号,平均每个账号抄袭搬运了数千条点评,合计抄袭572万条餐饮点评和1221万条酒店点评,占官网声称点评数85%。
IT阅读排行榜
2019/07/09
8.2K0
网络爬虫法律条文或出台:你的程序合法吗?
你的爬虫会送你进监狱吗?
随着大数据的火热,数据相关行业竞争不仅“蒸蒸日上”,爬虫之间的战争也越发地激烈。一篇《你的爬虫会送老板进监狱吗?》在程序猿圈子里被大量转载,甚至有的程序员因为非法获取数据的新闻从而放弃了这一行当。那么,爬虫是什么,它会是悬在程序员头上的达摩克利斯之剑吗?
崔庆才
2019/05/06
3.5K0
你的爬虫会送你进监狱吗?
有组织的捅马蜂窝违法了吗
今天的朋友圈被《我承认,我们是有组织攻击马蜂窝的》刷屏了。自媒体「小声比比」作者梓泉和「乎睿数据」的三名技术人员组成的「四人豪华犯罪团伙」,通过爬虫技术结合大数据分析,披露马蜂窝 2100 万条用户评论数据中的 1800 万条为造假数据,被马蜂窝以名誉权纠纷为由状告法院。
猫哥学前班
2018/11/06
1.2K0
有组织的捅马蜂窝违法了吗
java简单爬虫
发现是POST方式,参数有三个,一个是picType分类,一个是PageNum当前页码,pageSize每页条数
阿超
2022/08/16
7490
java简单爬虫
《刑法修正案(九)》:对网络黑产伸出重拳
2015年8月29日下午,第十二届人大常务委员会通过了刑法修正案(九),全称《中华人民共和国刑法修正案(九)》,自11月1日起正式施行。 关于执行刑法确定罪名的补充规定近日发布,涉及网络犯罪的补充、修
FB客服
2018/02/06
1.1K0
《刑法修正案(九)》:对网络黑产伸出重拳
《爬虫写得好,铁窗关到老》教你把握爬虫的法律边界!㊫
最近的IT公司违法案件越来越多,看了很多因为爬虫,数字货币,博彩网站外包等被抓的事情,给大家提个醒,打工注意不能违法,写代码背后也有法律风险。
不吃西红柿
2022/09/19
7180
【K哥爬虫普法】淘宝一亿快递信息泄漏,有人正在盯着你的网购!
2014 年 5 月初,被告人翁秀豪发现淘宝店铺源码存在漏洞,利用该漏洞可以在店铺源码中植入一个 url,执行该 url 指向的 javascript,以获取访问被植入 url 的淘宝店铺的所有淘宝用户的 cookie(淘宝用户登录时产生的一组认证信息,利用 cookie 可以执行对应帐号权限内的所有操作,无需帐号、密码),并利用其中的卖家 cookie 将 url 再次植入卖家淘宝店铺源码,实现自动循环,获取更多的淘宝用户 cookie。
K哥爬虫
2023/07/21
4840
【K哥爬虫普法】淘宝一亿快递信息泄漏,有人正在盯着你的网购!
【k哥爬虫普法】爬取数据是否一定构成不正当竞争?
谷米公司为开发和运营“酷米客”APP(提供实时公交查询服务),与公交公司达成合作,在公交车上安装定位器,以获取实时公交位置数据。谷米公司所收集的实时数据不仅被用于酷米客APP运营,还被提供给深圳市交委。深圳市交委基于信息化建设工作将该实时数据提供给深圳北斗应用技术研究院开展研究工作。经深圳市交委同意,深圳北斗应用技术研究院将深圳公交电子站牌数据测试接口开放给元光公司“车来了”(提供实时公交查询服务)APP应用。深圳公交电子站牌数据测试接口数据包含谷米公司所收集的公交车实时数据。但相比谷米直接从定位器上获取的实时数据,谷米提供给深圳市交委的数据存在一定的延迟。
K哥爬虫
2023/01/12
5600
【k哥爬虫普法】爬取数据是否一定构成不正当竞争?
华为易某调离岗位后未清理 ERP 登陆信息、并利用 bug 越权访问、将获得数据透露给第三方获利:判有期徒刑一年
易某于2006年12月至2018年3月期间在华为技术有限公司(以下简称华为公司)任职。因工作需要,易某拥有登录华为公司企业资源计划(ERP)系统的权限,可以查看工作范围内相关数据信息。 华为公司禁止员工私自在ERP系统查看、下载非工作范围内的电子数据信息。 2010年12月,易某从华为公司线缆物控部调任后,未按华为公司的要求将ERP账户线缆类编码物料价格的查询权限清理,至2017年底,易某违反规定多次通过越权查询、借用同事账号登录的方式在ERP系统内获取线缆物料的价格信息。 2017年以后,易某发现ERP
云头条
2022/04/12
4380
华为易某调离岗位后未清理 ERP 登陆信息、并利用 bug 越权访问、将获得数据透露给第三方获利:判有期徒刑一年
网络爬虫的注意事项
我今天要说的是关于爬虫的合法性,我希望通过一些案例来探讨:怎样做一个不触碰红线的爬虫开发者。
IT阅读排行榜
2019/09/25
2.6K0
网络爬虫的注意事项
17岁少年买不到回国机票,雇佣黑客攻击航空公司
2020年6月初,17岁的小陈因疫情原因滞留国外,由于无法买到回国机票而产生不满情绪。
FB客服
2021/08/24
4000
【k哥爬虫普法】非法入侵计算机信息系统,获取1500万余条个人信息!
2018年1月至7月期间,呙某兴通过SQL注入漏洞以及编写爬虫脚本的方式,侵入计算机信息系统,获取计算机系统内存储的大量数据,其中涉及到个人信息的数量约为1500万余条,该将其获取的个人信息通过QQ销售给“Versace”、“同花顺”、“FF”、“糖果”等人,从中获利约54万余元。
K哥爬虫
2023/01/12
6980
【k哥爬虫普法】非法入侵计算机信息系统,获取1500万余条个人信息!
记一次企业业务服务器渗透,WebLogic未授权代码执行
《中华人民共和国刑法》 第二百八十五条规定,非法侵入计算机信息系统罪;非法获取计算机信息系统数据、非法控制计算机信息系统罪;提供侵入、非法控制计算机信息系统程序、工具罪是指,违反国家规定,侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,处三年以下有期徒刑或者拘役。
王忘杰
2022/09/22
5080
记一次企业业务服务器渗透,WebLogic未授权代码执行
又一家数据公司被查,爬虫到底做错了什么?
以上是昨天技术圈传播的一则新闻,又一家数据公司被调查,很多数据从业者、爬虫开发者发出了“感叹” —— 「爬虫用得好,XX进得早;数据玩得溜,XX吃个够」。
Python数据科学
2019/09/10
1.2K1
又一家数据公司被查,爬虫到底做错了什么?
娄鹤:网络安全人员真的“安全”吗?
“由于对IT技术、互联网创新业务的热爱,始终在关注这个行业,也发现了一些现象和问题,特别是安全技术人员的弱势、背锅、无意识犯罪,感到非常可惜,也值得社会反思和法律人的投入。”
FB客服
2020/04/24
6370
如何用kali实时获取对方信息
首先梳理一下,主要三点,欺骗,截获,跑路! 目标,小姐姐手机ip192.168.0.102(别问我怎么知道的,直接nmap -sP扫描该局域网整个网段) 攻击机 192.168.0.104 网关 192.168.0.1 首先 打开ettercap ,然后选择sniff->unified sniffing,然后选择要抓包的网卡,如下图:
知识与交流
2021/04/02
5.2K0
如何用kali实时获取对方信息
只因写了一段爬虫,公司200多人被抓!
刚从朋友听到这个消息的时候,我有点不太相信,做为一名程序员来讲,谁还没有写过几段爬虫呢?只因写爬虫程序就被端有点夸张了吧。
谭庆波
2019/11/04
8590
窃取华三Comware源代码(研发成本 9.9 亿)、72 万出售,判 5 年 9 个月:购买方三人各判 3 年、2 年、2 年
被告人:魏某,男,1985年出生,大学文化程度,原系杭州华三通信技术有限公司员工 被告人:任某某,男,1975年出生,大学文化程度,北京楚航可信科技有限公司研发部负责人 被告人:姜某,男,1972年出生,大学文化程度,北京楚航可信科技有限公司总经理 被告人:雷某,男,1974年出生,大学文化程度,北京楚航可信科技有限公司董事长兼法人代表 一审查明事实: 2015年4月21日晚,魏某利用其在杭州华三通信技术有限公司(以下简称“华三公司”)研发部工作的便利,违反公司规定,使用手机、无线路由器等设备,通过技术手
云头条
2022/10/14
8561
窃取华三Comware源代码(研发成本 9.9 亿)、72 万出售,判 5 年 9 个月:购买方三人各判 3 年、2 年、2 年
推荐阅读
相关推荐
中国爬虫违法违规案例汇总!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档