不知道大家有没有看过这本书,这本书是我大二开学没多久一次中午去学校食堂,在旁边的小摊上看到了这本书。
作者是维克托·迈尔-舍恩伯格,可能你不认识他。其实我也对他不熟,但是我这辈子都会记得他说过了一句很有哲学的话—— “世界的本质是数据” 。我记得第一次在书中看到这句话的时候,除了一脸懵逼外,没有任何参悟这句话的思路。就那么过来半年后我在接触到数据分析学的时候,我才开始有了我自己对这句话的理解。
如果说这个世界的本质就是数据的话,那么请问这个的数据集在哪里?能够存储微观世界的原子夸克、宏观世界的宇宙万物的数据集会在那里?
我个人猜测存储在π中,这个圆周长与其直径之比的无理数中。
3.1415926,这是开始,后面一直有,无穷无尽永不重复。就是说在这串数字中,包含每种可能的组合,你的生日、卡号、QQ、手机号等都在其中某处。如果你把这些数字视成字母,可以得到现有的及可能有的每一个单词,你婴儿时发出的第一个音节,你前任的名字,你一生的故事,我们做过或说过的每件事,宇宙中所有无限的可能,都在这个简单的圆中。
(来源美剧疑犯追踪)
π还有什么特点,你可以在维基百科上对它详细了解一番。
维基百科网址
https://en.wikipedia.org/wiki/Pi
为什么我会说 “用 π 预知未来”,假设这个数据集就是π的话,我只需要一把密钥去读取π的数据信息就可获取其中信息。正是因为π是无限重复数据,存储我此时此刻的信息之外还存储了我明天以及往后的信息,何时工作、何时结婚生子、何时离世等等很多信息。
这把密钥是什么,怎么来的、怎么用现在我无法知晓。毕竟现在都没法证明π是个合取数,但是也没人能够π不是合取数。关于合取数和π搜索,我在这里给大家介绍一个网站,有兴趣的可以了解一下。
π 搜索
http://www.angio.net/pi/how.html
因为现在π已经计算出了它的前2亿为的小数位了,因为无人能够证明π不是合取数,便有人拿π开始做应用了,设计了一个π文件系统。
github链接
https://github.com/philipl/pifs
看到作者的README中的介绍,发现这个新的文件系统确实很吊,如果你电脑带有Linux系统的话不妨尝试一下。
作者πfs介绍(翻译版)
π与我的数据有什么关系?
π(或pi)是数学中最重要的常数之一,并且具有各种有趣的属性(您可以在维基百科上阅读)
推测π的一个属性是它是正常的,也就是说它的数字都是均匀分布的,暗示它是一个析取序列,这意味着所有可能的有限数字序列都会出现在某个地方在里面。如果我们考虑基数16(十六进制中的π,那么如果这个猜想为真,那么所有可能的有限文件都必须存在于π内,这是微不足道的。这一观察的第一个记录可以追溯到2001年。
从这里开始,如果π包含所有可能的文件,那么我们为什么要浪费那些存储这些文件的空间,当我们只能用π查看它时,这是一个小小的飞跃!
每个可能存在的文件?
那就对了!您创建的每个文件或其他任何已创建或将要创建的文件!版权侵权?它只是π的几位数!他们总是在那里!
但是我如何在π中查找我的数据?
只要您知道文件的π及其长度的索引,使用Bailey-Borwein-Plouffe公式提取文件的简单任务同样,您可以使用公式初步查找文件的索引
现在,我们都知道在π中找到一个长的数字序列可能需要一段时间,因此出于实际原因,我们应该将文件分解为更容易找到的更小的块。
在此实现中,为了最大化性能,我们分别考虑文件的每个单独字节,并以π查找。
所以我在π中查找了我的字节,但我怎么记得它们在哪里?
好吧,你显然必须把它们写在某个地方;你可以使用一张纸,但是记住我们通过将数据移动到π来保存的所有存储空间吗?为什么我们不在那里存储文件位置!?!更好的是,我们在π中的文件位置是元数据,因为我们都知道元数据在我们所做的每件事情中变得越来越重要。生成这么多元数据不是很好吗?当你可以处理元数据时,为什么要浪费时间处理老式数据呢?
是的,但如果丢失我的文件位置会发生什么?
没问题,位置只是元数据!你的文件仍在那里,坐在π - 它们永远不会消失,是吗?
为什么这么慢?我花了五分钟来存储400行文本文件!
嗯,这只是一个初始原型,不用担心,总有摩尔定律!
我们从哪里开始?
未来有很多潜力!
可变运行长度搜索和查找!
算术编码!
可并行查找!
基于云的π查找!
πfs用于Hadoop!
世界总会有无限的可能,所以我的直觉告诉我:我们可以用一个看似很小不起眼的π,来做我们都不曾想过的事情。例如:用 π 去预知未来。
领取专属 10元无门槛券
私享最新 技术干货