百度这两天争议不断,谷歌的日子过得也不舒坦。
当地时间1月21日,根据法国监管机构国家数据保护委员会(CNIL)提供的证据显示,Google的用户协议违反欧洲在2018年更新的《一般数据保护条例》 (General Data Protection Regulation,即大名鼎鼎的 GDPR),法国监管机构对谷歌母公司 Alphabet Inc 罚款 5000 万欧元!
这是迄今为止欧洲范围内,一家公司因违反隐私数据法遭受到的最高额处罚金。多家英文科技媒体报道时,都用了 “record high”(破纪录地高)描述处罚力度之狠。
根据欧洲的最新法规,谷歌违反的具体项目很多。比如:数据收集信息不透明、用户不了解情况数据收集情况、数据处理和存储时间等内容的完整信息并未全部出现在同一位置、Google搜索引擎未获得用户同意收集有针对性的广告数据等等。
到底是欧洲政府“截胡”还是谷歌“作恶”?
密谈记者通过调查发现了一篇美国范德堡大学出版的报告 -- 《谷歌数据收集(Google Data Collection)》。这篇长达53页报告的作者是该机构计算机教授道格拉斯C•施密特(Douglas C. Schmidt)。这篇报告揭露了谷歌毫无节制的数据收集行为。
(Douglas C. Schmidt,图自范德堡大学)
密探记者在惊讶之余,更感到了深深地恐惧。那么,谷歌到底对你收集了多少数据?又怎么把你的数据拿去使用了?下面,我们就来看看这篇报告。
教授做了个实验,然而…
施密特为了做这个实验,专门用一台新安卓手机,用新的 SIM 和新注册的谷歌账户,并给这位用户起名为“简(Jane)”,为我们讲述了一个谷歌用户的一天。
我们下面简单讲一下数据来源和调查方法。在这里,施密特教授通过下面的四类数据进行了这次调查:
第三方研究机构观察到的谷歌收集的数据。
(密探打开了自己的My Activity,一天活动暴露无遗)
“一个典型的场景是这样的:
报告截图
看到这似乎都很正常,毕竟“没有隐私、数据泄露”的当代生活已经不稀奇。那么,你的什么信息被收集了呢?谷歌又是怎么收集的?
一天340次跟踪,关手机、不用谷歌、关WIFI都没用
从数量上看,谷歌的服务器每天通过安卓设备传输 11.6 MB 数据,不断上传备份到后台。安卓手机手机的个人用户信息包括姓名、手机号码、生日、邮政编码、信用卡号码、手机上的活动(使用的应用和网站,包括如何使用)。
(报告截图:一个标准用户谷歌和苹果,安卓和IOS设备收集数据对比)
从上面这张图上,我们也可以看出安卓用户被谷歌公司收集信息的频率高达90次/小时,比谷歌收集苹果用户信息都要高出一倍多。有趣的是位置坐标数据收集还“很智能”,正在使用的手机比没有打开的手机被收集的数据量高出 1.4 倍。
但是,下面的实验发现关于收集方式开始让人细思恐极。下面,正式带你体验谷歌用户专享的“贴心服务”,全方位的“被动收集”是谷歌的独门秘器。
“一个休眠的安卓手机,只要 Chrome 后台处于活动状态,会在 24 小时内向 Google 传送位置信息 340 次。位置信息占发送给 Google 的所有数据样本的35%。相比之下,没有安装 Chrome 浏览器的 iOS Apple 设备,Google 就无法收集任何数据。”
报告截图
实验进一步表明,即使用户未与任何关键谷歌应用程序进行互动,谷歌仍然可以通过其广告客户和发布商产品收集大量信息。“安卓手机用户只要打开手机后,被动数据收集大幅增加,占向谷歌服务器发出的所有请求的46%。”
即使不打开谷歌的任何应用程序,不使用谷歌搜索,与谷歌服务器域的被动通信也会显着增加。谷歌为什么这样收集数据,收集的数据去了哪里?
一场好戏:打着“匿名” 的旗号反追踪
密探相信大家已经猜到了,这部分的数据活动影响背后的核心是谷歌广告盈利工具 —— Google Ads,Google Analytics 及 Google Ad Manager。谷歌提供给商家的工具在全球独一无二,发布商工具还有 AdSense 和广告客户工具,例如 AdMob,AdWords。
这些工具是怎么以平台的方式无处不再应用你的信息的呢?
报告截图,注意和上面不一样:苹果和谷歌设备从用户端被发送出去的信息
谷歌通过专门在系统标记据称“匿名用户”把收集好的数据拿来使用,赤裸裸的演绎了“此地无银三百两”。为什么呢?
因为谷歌会收集自家相关应用和第三方网页访问的活动数据,然后再与用户的谷歌身份相关联。主要通过安卓设备将“设备标识”传递给谷歌服务器实现的。同时,“广告标识符”也在这个时候派上了用场,形成了完整的闭合。
谷歌能够将通过被动方式收集的所谓“匿名数据”与用户的个人信息相关联 —— 绕了一大圈,最后大费周章用“合法手段”应用用户信息。
同样地,Google Ad Manager 的 Cookie ID(跟踪用户在第三方网页上的活动缓存信息)是另一个据称是“用户匿名”标识符。如果用户在同一浏览器中访问Google应用程序,Google 可以将其连接到用户的 Google 帐户之前访问过第三方网页。
看懵了?密探帮你清醒清醒,谷歌收集数据的特点都有这些:
利用各种产品,各种技术收集一般用户无法轻易察觉的方式来收集用户数据。
Google 的数据收集的主要部分发生在用户未直接使用谷歌任何产品时,尤其是在安卓移动设备上。
虽然通常在用户匿名的情况下收集信息,但Google明显拥有利用从其他来源收集的数据来对此类集合进行去匿名化的能力。
这篇完整的报告很长,也希望有兴趣研究试验方法和实验过程的同学去仔细探究一番,密谈在这里就不具体去讲技术和用户是从哪里被投放广告的具体细节了。
因为,实在是太多了。
YouTube 上的个性化广告只是一个例子,谷歌的广告业务覆盖了 90% 全球用户,200 万个主流网站,你的生活已经被谷歌的 “数据操控” 看了个清清楚楚明明白白。
这是不是很像《黑镜(Black Mirror)》里的某一集?
就和报告中概括道:“在上述产品中,谷歌大范围收集有关人们在线和现实世界行为的相关信息,然后用它们以付费为目标广告。比如,随着定位技术和数据的完善,Google 的收入显着增加。”
谷歌是互联网公司,也是广告公司
密探和你一样都热爱谷歌的产品,我们先来重新认识一下2019年的谷歌。
比如密探写这篇文章时,使用了谷歌的搜索引擎、安卓系统的手机、Chrome 浏览器、谷歌翻译和谷歌文档。还有,视频平台Youtube(油管),电子邮件服务谷歌邮箱(Gmail)和谷歌地图(Google Maps),这每一个平台的月活跃用户都超过了10亿,也都是在该领域世界第一。
谷歌帝国 / 图自 CS Open Source
谷歌的服务如此方便,但是作为免费用户,你给谷歌创造了多少价值?
根据福布斯(Forbes)的数据显示,谷歌 2018 年的利润共计 1.26 千亿美元,在世界 500 强盈利最多的公司中排名 14。谷歌进入福布斯世界 500 强今年是第13年,但其业务利润的增长曲线是指数爆炸式的。
图源:Statista
谷歌的母公司 Alphabet 不只是互联网公司,也是全球最大的数字广告公司,这才是谷歌“免费”却能够盈利的关键。这次法国监测机构的罚款,看上去很多,但实际上,这连谷歌 2018 年一整年盈利的百分之一都远远不到,只有 0.0045%。
这 “破纪录新高” 的罚款,对于谷歌来说,洒洒水而已啦!
密探之前很多次讨论过数据隐私的问题,但是在 2019 年实现数据保护还现实吗?科技公司仿佛科幻电影中的预言一般真的横扫了我们的生活,现在谷歌对我的了解就已经远远超过了我自己。
对于创业者来说,数据隐私相关的限制不够有力也许是件好事,这让更多的数据发挥作用,让更多有价值的产品改善我们的生活。但是,我们作为人对于隐私的需求可以完全抛弃吗?英语里有一句俗语叫做“Freedom is not Free”(自由从不是免费得来的)。
就算是我把所有产品都找到替代品,用微软邮箱,用 DuckDuckGo上网,用 Iphone 而不是安卓手机。只恐怕,这个做法长远来看也没有什么作用。
数据决定一切,也许是时代的必然,又或许是我们共同的未来。
你看完这篇文章准备扔掉安卓手机了吗?还是对谷歌有了新的看法?
领取专属 10元无门槛券
私享最新 技术干货