导读:你的日常活动正在产生大量数据!但其中很多数据也正在被你浪费。你以为数据与健康的关系,就是在朋友圈里晒晒步数?其实,并不需要复杂的技术,这些数据就可以帮你完成时间管理、监测你的健康状况,甚至为你的生活提供正确的指导和有价值的建议。
“时间去哪儿了?我今天都干嘛了?”
“我每天都泡枸杞,真的包治百病了吗?”
“腿伤刚好,我该去健身房撩TA & 被撩吗?”
这些问题别问别人,你自己制造的数据就会给你答案。这些数据怎样获取?怎样记录?怎样分析?本文用10条建议和7个步骤,帮你实现“量化自我”。另外文末有送书福利,别错过!
本文为大数据(ID:hzdashuju)原创,转载请与我们取得联系
作者:土豆小姐,不想当网红的旅行者不是好编辑,马蜂窝@土豆OHC
01 什么是量化自我
人们现在总是在量化自我,每天有一系列数字跟随着我们:睡觉的时间、走路的步数、用了多长时间挣钱、浪费了多少时光、交朋友的数量、发朋友圈的数目。量化自我处于一种爆发状态。到2016年年底,有高达1.1亿个可穿戴传感器被运输到世界各地。
“量化自我”这一概念,即对于自身的数据,人们如何记录,为何记录,怎样分析以及做出何种反应。量化自我是一项人类活动,比起那些推动量化自我广泛传播的各种设备,量化自我本身更加有趣,它不需要比纸和笔更复杂的技术。
然而,无论是通过可穿戴电子设备,如智能手表和健身手环,还是通过手机、计算机,现在很多自我记录的方式都是数字化的。这些高科技记录方式,与人们几个世纪以来量化自我的方式(比如写日记或日志)交织在一起。像这样的数字化量化方法的增多,就引发了关于旧传统的新问题。技术扩展了可以测量的生命领域,让前所未有的更高频率的记录成为可能。
02 持续量化的世界
“量化”并不是新近产生的。本杰明·富兰克林(Benjamin Franklin)是18世纪美国政治家,他持续地记录了自己如何花费时间,以及是否达到为自己制定的目标。他用图表和便条的形式量化,来“执行自我检查计划”。
这种以日记形式进行的日常量化很常见,事实上在18世纪,日记是被共享的。人们使用相对简单的条目,按顺序简短地记录发生的事。通信学者李·汉弗莱斯(Lee Humphreys)和她的合著者发现,今天的推特与十八九世纪的日记非常相似,都是“用当前时代的传媒方式与他人探讨、反思、交流和分享”。
20世纪20年代的发明家巴克敏斯特·富勒(Buckminster Fuller)也量化自己,他的做法是:创建一个大型的剪贴簿,严格地每15分钟记录下一些东西。从某种意义上说,这两种风格体现了今天仍在持续的自我量化思路,一种是数据在改变生活的过程中发挥主动作用,另一种则是被动地支持个人反思。
今天,我们可能会把富兰克林的方法称为“自我量化”;而将富勒的称为“生命记录”,它是自我量化的近亲,虽然只是近亲,但它可能比我们想象的更具干预性。
对于我们现在所称的自我量化,富兰克林的尝试具有非工具性和思考性,与我们最初所认为的相比,他的方法其实更像“生命记录”。除了历史上的这两种方式以外,我们需要加上第三种——主动的自我实验。在出现现代临床试验之前,自我实验是科学工作的重要组成部分。为了解眼睛的运作方式,艾萨克·牛顿爵士(Sir Isaac Newton)盯着太阳的反光,差点失明。在当时布洛芬、疟疾疫苗和神经科学的历史中,都曾有过自我实验,并且直到现在,自我实验者仍持续做出重要发现。
所有这三种方式(自我量化、生命记录、自我实验),都对我们如何看待自我产生了影响,并都有各自的历史。
03 怎样量化自我?这里有一些建议和提示
《量化自我》的作者吉娜·聂夫(Gina Neff) 和唐恩·娜芙斯(Dawn Nafus)建议大家在开始自我量化项目的阶段,需要考虑收集一些因素:
1. 要有一个简洁的开始
自我量化应该从有人做过的简单实验开始,比如可以在几天或几周内完成的。虽然通过几个月或者几年时间来量化,会带来不一样的好处,但第一个项目不应长期占用你的时间。
2. 聚焦于一件或两件事
量化必然会产生对日常生活的片面看法,也不可能从许多片面的观点中构建出一幅全貌。利用偏向于你优势的地方,把注意力引向最重要的问题。
3. 合理命名数据
尽可能用与经验相符的方式标注数据。有时,在实际的生活场景中,提问可以帮助你找到需要被量化的东西。比如,在回答诸如“今天你想远足吗”这样的问题时,可能能对肌腱炎的疼痛程度进行量化。
4. 时间和地点都是很好的数据管理器
提高数据集合反映的观点的精确度,结合实际情况,具体指的是,比如每天固定在某一时间拍照,或每次进入一个地方时拍照。
5. 对量化工作实事求是
每小时记录一件事,坚持两天很容易,但是对于大多数人来说,持续两天后,这个项目很可能就此停止,不会继续坚持了。考虑你实际想投入多少时间和精力到量化项目中,并且考虑在一天中何时记录比较方便。
6. 数字、文字和图片都很重要
有时记下一个单词或拍照可能会成为最有力的记录,特别是在时间也被自动记录的情况下。通常,传感器数据最好与手动记录的笔记或其他数据相结合,便于理解。
7. 数据有不同的尺度
如果你使用的是数字尺度,请注意尺度本身传递的信息。用5分制计分,可以留有中间立场;用6分制计分,将迫使你进行选择。有时粗略的尺度(如低、中、高)比10分制的选择更有效。在统计学中,数字9和99常常代表“丢失”的数据或无意义的问题。比如,你可以用1~10来量化心情,用99来代替心情没法被明显辨别的某一天。
8. 文字和图片有数量要求
单词的频率可以计算,所以它们变成了数字。像750 Words这样的程序,可以在任意段落中计算关键字出现的频率,这能为你关注的事物提供线索。一些人每天简单记录觉得高兴的事,然后用750 Words来分析,用以量化心情。通常这样的项目会与情绪分析同时进行,以确定这些词的语气是积极还是消极。
9. 自我量化工具不一定要花哨
应用程序开发人员试图对显示数据的方式做出好的猜测,哪些数据可能有用,哪些计量尺度更实用,哪些词更重要等,但这些都是猜测。纸和笔的记录、Excel表格、谷歌表单(Google Forms),或通用的自我报告应用,给了你对于信息记录的更多控制力,并且当项目发生改变时,可以获得更多能力去改变和调整。
10. 开展几次试运行
在你第一次尝试时,有些东西达不到预期是很正常的。也许是选择的数据规模不太好,也许是收集数据的频率不现实。对自我量化项目进行修改,直到确定可行的方案。
04 量化自我与数据分析:7招搞懂你的数据
假设你现在已经做了以上事情,并且手上有了一部分数据,你会问自己:现在该怎么做?下面我们列出了一些你可以使用的数据分析方法,这不要求你掌握新的统计或可视化技能。这是关于如何分析数据的建议,即如何寻找帮助你发现模式、找到趋势和完成拼图的东西。
1. 时间和地点是强线索
大多数人在看图表时,都很自然地寻找规律,并试着解释我们看到的峰值。因为数据的时滞性,数据集的两个峰值即使相关,也不会直观地排列,那么你将不得不添加一个临时调整时间戳,比如加上或者减去适当小时数,直到看到峰值之间的联系。
在线形图中,很难通过肉眼看出递归和时间滞后性,但有一些方法可以使它们变得明显。比如,可以把图表打印出来,圈出每个“周一”,以便从视觉上放大这个规律。在电子表格里,你可以把数据拷贝到新表格中,删除所有与峰值无关的数据,然后查看时间栏,看看是否有共同的一天或一周的规律。
2. 滑动平均可以解释潜在趋势
滑动平均显示的每个数据点,是前面几个数据点的平均值。这个数据,直观地反映了数据的上升或下降趋势。自然状况下,体重会正常波动,与每天的体重读数相比,一周的平均体重是体重增加或减少的一个更好的指标,并且,平均数也可以减少焦虑。在数据密集且变化量大的情况下,滑动平均也能作为一种可视化工具。
3. 注解
数字不会讲故事,但人会。在图表上记下评论或插入图片,可以帮助还原数据中的故事。任何你能找到的其他事物——照片、音频资料,当时写下的某些东西——都能帮助你在所量化的指标和未量化的指标之间建立联系。
4. 拼贴画能支持视觉上的意会
当同一事物的照片(食物、药丸、脸)以一个系列的方式显示出来时,一些模式会通过形状和颜色产生。以这种方式量化会使数学计算更加困难,但视觉模式比数字更能产生强大的反馈。无意中捕捉到的位置信息,或是一个物体的包装,或是其他意外被拍摄到的人,都可以帮助你回忆起当时的情形,或者捕捉到你最初可能没有想到的额外信息。
5. 缺少数据并不意味着真正的缺失
缺失数据的修补是有意义的,它们本身也可以成为数据。在量化某一特定活动时,关注不做某件事的模式,而不是关注做了什么,可能会带来不同的解释。
6. 讲故事是一个使故事精练的好机会
当人们不得不向别人解释数据时,往往会花时间更仔细地思考数据。通过与别人交谈数据,发现其他人看到的东西,可以成为数据本身另一个有用的镜像。
7. 与他人比较可以提供参考
和我们交谈过的大多数自我量化者都没有意识到,探究自身数据是否偏离人群的平均水平是很有用的。不管怎样,参考其他人的数据样本,可以看到可能的变化。
一旦人们有机会查看自己的数据,其中一些人可能会寻求改变。收集数据在某种程度上产生了一种能感知到的负担。如果你量化咖啡因,希望能缓解症状,然而量化结果却显示,饮用多少咖啡因并不重要,你会发现,本以为通过量化能控制症状,但最终结果让人失望。实验可能也确实会失败,选择你不想知道的和选择想知道的一样重要。
然而,值得记住的是,一个问题如果能成功解决,意味着它实际上并不是个问题。人们使用数据来平息担忧,我们已经看到了很多这方面的例子。
05 说说你日常的量化自我
5种自我量化的常见风格或目的:①监测和评价;②引发感觉;③审美好奇心;④调试问题;⑤培养习惯。
我们提供了人们在每个方面所做的事情的例子,以及关于以这种方式量化的实际建议,这有两个原因。一是鼓励你自己去尝试,这涉及在设备手册中找不到的别人发现的想法和陷阱。二是即使你没有兴趣尝试自我量化,当你看到人们为了体验其他人带来的创造力而努力,且遇到难题时,你也可以帮忙解决。
正如评论家叶夫根尼·莫罗佐夫强烈提倡的,自我量化,不是让人们不加思索地跟随计算机的指令去做,也不是允许用技术代替感觉和情绪。
近年来似乎有一阵健身热和慢跑热,很多人都在朋友圈晒“战绩”和“战况”。VKKKKK大魔王就是其中的一位,但她的每张跑图后面,都是量化自我的记录。
▲图片及案例由VKKKKK大魔王授权使用:VKKKKK大魔王,爱美食的举铁女汉子,爱旅行的纹身美少女,爱分享生活中的一切美好,小红书@VKKKKK大魔王
你能在图片中看到跑步途中的风景、距离和“轨迹形状”,用一个叫做nike+的app进行记录。与此同时,她还用另一个app——KEEP记录更多的数据,分析数据背后的内容,以此判断哪些数据最适合自己的跑步目标,现实与目标之间的差距是否需要被消灭,最终调整跑步速率、坡度、以及拉伸方案。
这是许多自我量化者需要学习的。许多自我量化者把这个过程看作一种反馈回路,这是一个计算机科学术语,即由系统生成信息,然后根据这些信息进行调整。反馈回路不是自动的。一些人可能会认为VK大魔王的追踪方法不精确,但她选择使用数据综合分析,而不是记录跑步的距离,并传达了比更精确的方法更重要的信息。
延伸阅读《量化自我》
转载请联系微信:togo-maruko
推荐语:不要只把行走步数、睡眠时间、心率监测、体脂测量等数据作为朋友圈的日常PK,要让数据为我的健康所用,量化自我,看这一本就够了。本书作者吉娜·聂夫是华盛顿大学通信与社会学助教,高级数据科学家。唐恩·娜芙斯是英特尔研究院的高级研究员,也是一位人类学家,在工业领域工作,为技术发展提供信息。译者方也可是北京师范大学经济学专业优秀毕业生,曾在德国路德维希港经济应用技术大学游学半年。酷爱数字与数学,学习、工作中长期与数据打交道,擅长用数据分析业务开展状况、识别目标客群。知乎主页@方也可