Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >抓取数据可能会吃官司?请看好你家的爬虫!

抓取数据可能会吃官司?请看好你家的爬虫!

作者头像
罗超频道
发布于 2018-04-27 09:06:05
发布于 2018-04-27 09:06:05
1.2K0
举报
文章被收录于专栏:罗超频道罗超频道

历时两年的微博与脉脉之争终于有了结果:法院认定脉脉非法抓取、使用微博用户信息行为构成不正当竞争,一审判决脉脉停止不正当竞争行为,并赔偿原告经济损失等220余万元。两年前我有关注到微博与脉脉的数据之争,这在口水战每天都发生的互联网圈本来不算什么大事。但这次法院判决结果,还是挺出人意料的。毫不夸张地说,这一事件给互联网公司敲响了关于用户数据保护的警钟。

一个常规的数据抓取纠纷

先简单说一下微博和脉脉之争的来龙去脉。

2014年8月公开闹掰:微博宣布停止脉脉使用的微博开放平台所有接口,理由是“脉脉通过恶意抓取行为获得并使用了未经微博用户授权的档案数据,违反微博开放平台的开发者协议”。与此同时,脉脉宣布终止支持微博登录,并通过一些邮件截图曝光微博此举,是因其投资脉脉不成,索要脉脉用户关系数据受阻后的报复。就像所有口水战一样,双方各执一词、真相扑朔迷离。

2015年3月对簿公堂:微博主体公司于2015年3月将脉脉主体公司告上法庭,微博脉脉之争升级。

微博起诉理由主要有脉脉非法获取和使用微博信息,商业诋毁等。

在用户微博登录脉脉并上传个人通讯录之后,大量非脉脉用户的微博头条、昵称、职业、教育等信息出现在脉脉上,这些信息并不在微博OPEN API之中,并且在微博停止脉脉所有接口权限之后,脉脉依然进行了相关数据抓取,微博认为脉脉通过非法手段获取信息。除此之外,微博认为在双方“闹掰”之后脉脉发表的公开言论对微博商誉构成了诋毁,脉脉采取了类似于微博加V认证的机制和界面设计,构成不正当竞争。

法院认定,脉脉绕过OPENAPI抓取数据的行为,危害到微博用户信息安全,损害了微博合法竞争利益,对其构成不正当竞争,商业诋毁成立,判决脉脉停止不正当竞争行为,并赔偿原告经济损失等220余万元。

类似诉讼在互联网行业屡见不鲜。

  • 2013年,百度因奇虎360违背Robots协议抓取复制百科等内容构成不正当竞争,起诉后者并索赔1亿元。
  • 2016年2月,因认为百度视频通过抓取播放窗口的方式,嵌套乐视网视频资源到百度视频客户端,屏蔽了乐视网网页、网址、广告,造成公众混淆,构成不正当竞争,乐视起诉百度并索赔100万元。
  • 2016年4月,大众点评诉百度旗下的百度地图及百度知道大量复制其用户点评等信息,构成不正当竞争,提出9000万元索赔要求。

这些案例均是某平台因内容被抓取起诉抓取方,在数据为核心资产之一的互联网产业,“数据纠纷”只会越来越多。

平台用户数据受法律保护

从法院一审的判决逻辑来看,是否保护用户信息已成数据纠纷中的法律准绳。

海淀法院在“世界知识产权日”公开宣判这一案件,或许不是巧合。其明确表示,“大数据时代,保护用户信息是衡量经营者行为正当性的重要依据,也是反不正当竞争法意义上尊重消费者权益的重要内容。”这表明,用户权益被摆在最优先位置。

在“人肉”这类网络暴力频发、用户资料屡屡泄露的大环境下,这一判决具有示范意义。平台在业务设计上必须充分考虑用户信息保护,确保用户信息不被滥用,隐私数据不遭泄露,同时确保用户对个人信息的使用有知情权。

在保护用户利益之后,才是平台利益。

值得注意的是,用户信息与用户数据并不是一回事,比如你在微信公众账号发的文章,算是用户数据,但你个人微信昵称、头像这些资料,才算是用户信息。但究竟哪些属于用户隐私则很难说,你上传到平台的照片肯定是隐私数据,但你发的公开微博就不一定了。那么,不具备“个人隐私”属性的数据是否受法律保护呢?如果有人绕过接口,抓取用户发的微博而不是个人信息,会有不同的结果吗?

这里有一个案例:百度起诉360违反Robots协议抓取知道、百科等数据的纠纷就是这样的情况,法院尊重Robots协议和平台对UGC数据的权益,360被判赔偿百度70万元。就是说,UGC内容的创建者是谁并不重要,搭建平台网站投入运营、技术和人力成本,拥有对数据的使用权和分发权。如果第三方网站违背意愿进行抓取,就可能被判为不正当竞争。

数据是互联网公司的核心资产,不论是个人信息还是UGC数据(微博、文章、点评等),所有这些平台数据都将受到法律保护,平台对这些数据拥有所有权、使用权和分发权。

互联网公司应提防数据纠纷

互联网公司想要利用别家平台的数据时,必须遵循对方的公共API协议,或Robots爬虫协议,抑或通过正式协议合作。数据受法律保护。互联网公司不能违背某平台意愿抓取其数据——在技术上或许并不难,可通过爬虫等手段绕过限制,实现数据抓取,但这样做很可能会吃官司,并且败诉几率相当高。

因为数据抓取纠纷而对簿公堂的案例还不算多,但数据抓取行为在互联网行业却很常见,比如许多平台都能看到豆瓣电影评分数据,再比如一些导购网站聚合了电商平台的评论,还有平台将微信公众账号所有文章都聚集起来…这些行为理论上来说都有数据纠纷的风险,如果你做得不够大平台一般也没这个精力理你,但万一你某天做到了呢?况且,很多大公司也这样干。

对于数据的获取和使用,不再是一个技术问题、商业问题、道德问题,而是一个法律问题,所以,请看好你家的爬虫。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-04-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 罗超频道 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
数据抓取与利用行为的不正当竞争法规制
编者按: 随着大数据时代的来临,数据的利用纠纷在司法实践中初露端倪。数据虽然在新修订的《民法总则》中作为一种新的客体出现,但其客体的范围、权利归属,权利界限在立法中几乎还是空白状态。本文将通过几个案例说明数据利用行为在司法实践中的规制。 一、引言 “网易云音乐”里有一项非常令人喜闻乐见的功能——“日推”。根据你经常听的歌曲类型,每日推送20首音乐,有好久以前听过早就忘记了歌名却一直村与记忆深处的老歌,或者之前不知道在哪听过只是知道其中一部分旋律,心心念念求而不得的歌等等,常常令人惊喜甚至是惊艳。日推功能也成
企鹅号小编
2018/01/15
2.1K0
数据抓取与利用行为的不正当竞争法规制
更新用户协议被网友怼了,微博对第三方抓取为何如此忌惮?
昨晚,微博用户协议更新被用户怒怼一事,被部分媒体评价为是微博2017年最大的公关危机。互联网用户协议一直都是神奇的存在:没什么人看,却每个互联网平台都有、每个人都表示同意。9月15日晚上,被网友扒出的微博用户协议条款引发一些内容创业者注意,被媒体报道后引发用户不满,甚至误解,更有人说,微博此举是想要“空手套版权”。那么,事实究竟是怎样的? 微博遭遇公关危机只因用户协议语焉不详? 引发用户不满的内容位于新版用户协议1.3条中: “用户同意不可撤销授权微博平台作为内容的独家发布平台。用户所发表的微博内容仅在微
罗超频道
2018/04/16
8340
更新用户协议被网友怼了,微博对第三方抓取为何如此忌惮?
你的爬虫会送你进监狱吗?
随着大数据的火热,数据相关行业竞争不仅“蒸蒸日上”,爬虫之间的战争也越发地激烈。一篇《你的爬虫会送老板进监狱吗?》在程序猿圈子里被大量转载,甚至有的程序员因为非法获取数据的新闻从而放弃了这一行当。那么,爬虫是什么,它会是悬在程序员头上的达摩克利斯之剑吗?
崔庆才
2019/05/06
3.5K0
你的爬虫会送你进监狱吗?
谁动了我的数据?
编者按:数据泄漏正成为全球互联网企业信息安全的重灾区,最近一段时间,信息泄露事件可谓接二连三。 故事我们先从一只老鼠说起 2017年1月16日,新浪微博上一只老鼠成了网红。网友@筱东嘚 在修汽车时发现老鼠居然在其汽车里藏粮食。他本意只是晒图,可万万没有想到,网友评论居然都偏向了老鼠…… 大家群情激奋,纷纷为老鼠鸣不平,复杂的情绪着实耐人寻味,背后隐藏的逻辑其实很简单那就是“个人财产神圣不可侵犯”。 在互联网时代你的信息资产也同样面临“被没收”的风险,让我们回顾一下近期发生的几个重大信息安全事件。 事
小莹莹
2018/04/19
9360
谁动了我的数据?
互联网行业法律动态报告(2015年2月)
腾讯研究院法律研究中心 重点内容: 【网络治理】民诉法司法解释出台,明确聊天记录等可作为民事案件证据,电子证据的合法性得以确定;“快播案”历时一年多,CEO王欣等4人因涉嫌传播淫秽物品牟利罪被海淀区人民检察院提起公诉;争议多年的“网络中立”问题迎来历史性投票,宽带互联网被重新分类,付费优先、减慢特定内容网速、ISP自行屏蔽等被明确拒绝。 【知识产权】最高院就审查知识产权与竞争行为保全案件司法解释公开征求意见,针对已经具有一定司法经验的知识产权领域进行尝试,同时将司法解释扩展至竞争法领域;国家
腾讯研究院
2018/02/02
1K0
中国互联网不正当竞争案件发展实证分析(一)
张钦坤      腾讯互联网与社会研究院副秘书长       摘要:随着互联网产业的快速发展,新型互联网不正当竞争案件越来越成为关注的焦点。在数据统计和分析的基础上,试图从纷繁复杂的案件中整理出互
腾讯研究院
2018/03/09
2.1K0
中国互联网不正当竞争案件发展实证分析(一)
五年官司终败诉,万亿爬虫大军蠢蠢欲动
这算得上是爬虫斗争历史上具有里程碑意义的一个裁决。本周一,美国法院裁定,数据分析公司 HiQ 控诉 LinkedIn 案维持原判,并且认定从公共网站收集个人资料完全合法。
深度学习与Python
2022/06/11
4620
五年官司终败诉,万亿爬虫大军蠢蠢欲动
互联网行业法律动态年度报告
腾讯研究院:张钦坤 田小军  王琦 余俊缘 一、网络治理篇   多边民主透明——我国参与全球互联网治理   7月16日,中国国家主席习近平在巴西国会发表《弘扬传统友好共谱合作新篇》的演讲中提出,国际社会要本着相互尊重和相互信任的原则,通过积极有效的国际合作,共同构建和平、安全、开放、合作的网络空间,建立多边、民主、透明的国际互联网治理体系。此后,国信办主任鲁炜在2014年夏季达沃斯论坛中提出“多边、民主、透明”的全球互联网治理共识。   10月15日,美国政府重申对互联网管理的立场,称现阶段多方共同管理
腾讯研究院
2018/02/02
1.6K0
互联网行业法律动态年度报告
中国互联网不正当竞争案件发展实证分析(二)
张钦坤      腾讯互联网与社会研究院副秘书长 三、互联网不正当竞争案件的特征    纵观126件互联网不正当竞争案件,从侵权行为本身到侵权结果,再到案件审理都反映出一些典型特征,主要包括以
腾讯研究院
2018/03/09
1.5K0
中国互联网不正当竞争案件发展实证分析(二)
ROBOTS第一案尘埃落定:尊重行业协议
“拖了”近一年的百度起诉360不正当竞争案终于尘埃落定,百度起诉360违反ROBOTS协议抓取和复制知道、百科等百度数据,索赔1亿元人民币的官司在去年10月开庭审理。因为ROBOTS协议复杂性导致此案一直悬而未决,今日一审判决结果为,360违反《反不正当竞争法》相关规定,赔偿百度70万元。法院同时驳回百度其他要求。这是中国首例ROBOTS协议纠纷诉讼,判决结果具有极强示范意义。这场官司历时一年才得以宣判,在于其存在两大症结:ROBOTS协议是否受到法律保护和UGC(用户创造内容)的数据所有权的争议。 法律
罗超频道
2018/04/25
5420
3Q最后一场诉讼昨开庭 360表示愿和解
发表评论 733 views A+ 所属分类:电脑 庭审最后360表示愿和解腾讯未表态此前40余企业签约禁安全软件不正当竞争   昨日上午,腾讯诉奇虎360扣扣保镖不正当竞争一案在最高人民法院开庭审理,这距离之前的360上诉腾讯“反垄断第一案”仅过去了一周,该案件也同样受到了各方关注。值得注意的是,此前一天,中国互联网协会组织互联网相关企业签署了《互联网终端安全服务自律公约》(以下简称《公约》),对安全类软件的行为做出了规范,并对不正当竞争行为作了明确界定。   据悉,在2010年2月春节期间
用户1127987
2018/06/04
4870
我们不再需要3Q大战!!
2010年11月3日,腾讯作出了一个“艰难的决定”:宣布在装有360软件的电脑上停止运行QQ软件,用户必须卸载360软件才可登录QQ,要求用户“二选一”。
罗超频道
2019/04/30
8080
我们不再需要3Q大战!!
字节跳动将开启员工期权兑换;调查:半数互联网人有离职计划;腾讯副总裁因违反竞业协议,被判赔偿超千万 | Q资讯
字节跳动将开启员工期权兑换,价格为 126 美元 / 股;腾讯 PCG 组织大调整;由于芯片短缺,华为手机多款机型将取消配送充电器;美团再败诉,因不正当竞争被判赔 35.2 万元;Arm 中国起诉三名高管,力保现任 CEO 吴雄昂控制权;蚂蚁集团再四部门被约谈后公布整改方案;被罚 2.4 亿元终身禁入证券市场后,贾跃亭:证据不足,应从轻处罚;腾讯副总裁因违反竞业协议,被判赔偿科大讯飞 1200 万……
深度学习与Python
2021/04/21
9890
秦 健:从行业视角浅谈互联网竞争
秦 健  百度公司法务部高级法律顾问   我今天分享的内容可以概括为三条曲线、四个痛点、一个总结、三条建议。  一、互联网行业及不正当竞争发展的三条曲线   2015年政府工作报告中李克强总理已经提出,不管是对于整个知识产权的保护,还是对于侵权行为的打击,都已经上升到了国家战略的高度,为什么这样?我们可以看一看,以高新技术产业为代表的互联网,中国的互联网市场已经成为全球第一,不管是互联网的用户数还是用户的渗透率,都已经成为世界第一。而同样互联网对于GDP的贡献已经超过了美国、德国、法国等等互联网发
腾讯研究院
2018/03/07
6280
秦  健:从行业视角浅谈互联网竞争
安全软件应遵循的三大竞争原则
张钦坤  腾讯研究院副秘书长 田小军  腾讯研究院法律研究中心研究员   近年来,安全软件与其他互联产品之间的不正当竞争案件层出不穷。笔者曾统计我国自2002年至今的126件互联网不正当竞争案件,安全软件与普通软件案件纠纷占纠纷案件总数的31.48%,较多出现的情形是软件之间的干扰和冲突,具体表现为冲突提示和安装失败、强制卸载等其他严重影响相关经营者权益、消费者利益及市场竞争秩序的情形。有关法院在裁判过程中,结合对互联网竞争特点的分析,以及对《反不正当竞争法》一般条款的理解,形成了针对安全软件的三
腾讯研究院
2018/03/09
9660
海淀法院李颖:深度链接与聚合搜索典型案件及初步探讨
   10月24日,由腾讯互联网与社会研究院与《中国版权》杂志社联合主办的“第二届中国互联网新型版权问题研讨会”在京举行。本次论坛的主题是内容聚合与深度链接的法律问题。研究院将陆续推出本次研讨会的精彩
腾讯研究院
2018/03/13
2.1K0
海淀法院李颖:深度链接与聚合搜索典型案件及初步探讨
网络爬虫法律条文或出台:你的程序合法吗?
2018年10月20日,一篇《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章一出世便走红网络。文中称百亿体量的马蜂窝,其中2100万条“真实点评”中有1800万条是通过机器人从大众点评和携程等竞争对手抄袭而来。通过语义分析、数据挖掘,发现了7454个抄袭账号,平均每个账号抄袭搬运了数千条点评,合计抄袭572万条餐饮点评和1221万条酒店点评,占官网声称点评数85%。
IT阅读排行榜
2019/07/09
8.1K0
网络爬虫法律条文或出台:你的程序合法吗?
拦截“正当经营的互联网广告”行为的违法性分析
谢兰芳   西南政法大学知识产权法博士研究生     王  喆   腾讯公司法律顾问 关  悦   腾讯公司高级法律顾问   正当经营的互联网广告已成为广告市场繁荣发展的重要支撑,也是互联网企业收入增长的重要领域,对此类互联网广告进行拦截的不正当竞争行为势必有碍行业发展。虽然近年来我国已有多起司法判决对广告拦截行为的违法性进行了认定,但广告拦截软件/插件(下统称为“插件”)的开发市场却仍呈“雨后春笋”之态势。   互联网广告并非广告市场野蛮生长的伊甸园,只有正当经营的互联网广告才应
腾讯研究院
2018/02/01
1.1K0
互联网行业法律动态报告(2014年12月)
互联网行业法律动态报告(2014年12月) 腾讯互联网法律研究中心 重点摘要: 2014年12月,网络治理、网络犯罪、知识产权、竞争规则、电子商务、互联网金融、个人信息保护等领域热点频出。 【网络治理】国务院办公厅印发《关于加强政府网站信息内容建设的意见》;广告法修订草案二审稿增加针对网络广告违法的规定。 【网络犯罪】全国“扫黄打非”办公室通报了5起打击网上淫秽色情专项行动案件查处和判决情况;英国加强未成年人保护立法。 【知识产权】国家版权局官方网站通报了《“剑网2014”专项行动
腾讯研究院
2018/03/09
9530
腾讯诉360二审今开庭:审判阵容豪华
发表评论 705 views A+ 所属分类:新闻 11月26日奇虎360诉腾讯垄断的“首例互联网反垄断案”刚在最高人民法院开审,今天,腾讯诉360不正当竞争案二审在最高院正式开庭。诉讼双方名气大、在最高人民法院审理、五位法官组成合议庭、在普法日开庭、诉讼金额高达1.25亿……,这些因素使此案被称为“互联网反不正当竞争第一案”。   十年一次的审判阵容   今年4月,腾讯起诉奇虎360不正当竞争一案在广东高院审判结果是奇虎360构成不正当竞争,向腾讯赔偿500万元,并在网站首页和媒体道歉。当时
用户1127987
2018/06/05
2980
推荐阅读
相关推荐
数据抓取与利用行为的不正当竞争法规制
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档