何宝宏 何所思
数据是垃圾。如果说垃圾邮件和骚扰短信等是垃圾信息,那么DDOS和钓鱼网站等则就是“有害垃圾”了。这些垃圾数据,大多数已并非人类生产的,而是以工业化的方式通过爬虫等自动生产的了。访问网页的超过65%流量是机器爬虫产生的,验证码的使用就是为了阻挡机器自动登录。
数据是信息。无论是互联网、话音网还是广播电视网,都有一个基本假设:网络是用来传递信息的,网络是要原样传递信息,文字、图片、话音和视频都是信息。因为数据是信息,于是互联网就要强调开放、共享和交换。
数据是资产。大数据就是在数据的垃圾堆中,利用高科技做翻捡提炼,希望找出有价值的信息来。缺乏管理的数据,就是垃圾。
传统的数据技术,就像还没发明望远镜靠肉眼的时代,建立了原始天文学。
现在的大数据技术,就像刚发明了望远镜的年代,群星闪耀,旧世界的观念开始崩塌而新体系还没建立。
AI的数据技术,在视觉和声音等认知方便可以窥探到一些智能的秘密,但时有失手还不是普遍真理。不透明不可解释的机器学习,充满了神秘主义的色彩。
大数据提出了“数据是财产”的口号,现在却被区块链/Token的给直接实现了。历史上上,数据一直是现实世界中资产的镜像但比特币/Token/区块链让数据自身成了资产,不再是资产的附庸,不再需要从海量数据中提炼。
比特币等把“数据是资产”的概念暴力升级了,一串加密后的数据都不用提炼,直接就成了资产,成了“货币”。
黄金本不是货币,2000多年来用的人多了就成了货币。比特币本不是货币,10年年来用的人越来越多,就疑似货币了。不要管自己信不信,只要别人相信有价值,就是货币。
数据是资产,但现在还不是大宗商品。
但如果数据是资产,就要强调所有权、保护、交易、防篡改和双花等。当数据代表资产时,底层技术的核心逻辑,就与数据代表信息时完全不同了。互联网是设计用来传递信息的,虽然也可以用来传递资产但会很别扭,于是就有了价值互联网的概念,以区块链技术为代表。
数据是隐私。数据是信息,隐私是一种特殊的信息,资产也是一种特殊的信息。但在很多情况下,隐私却不是资产。
至少,数据是资产,但数据也是垃圾,数据也是信息,数据也是隐私。至少,不能简单的把数据当做资产。
领取专属 10元无门槛券
私享最新 技术干货