阅读文本大概需要 6 分钟。
90 后共同的回忆
2018 年 00 后最小的也都 18 岁,我们 90 后早已不再年轻。社会也总是充斥着同龄年的压力,前段时间各大媒体都在宣传着类似这样的观念:你还在每个月领着微薄的薪水?而你的同龄人已经身价上亿了!似乎每个 90 后都应该事业有成,家产都应该上亿。这样你才是一个合格的 90 后。才不会被自媒体人鄙视。
但现实中有多少个 90 后能有如此成就?大部分 90 后都跟我一样只是普通人。每天按时上下班,周末的时候约朋友一起出来玩。生活或许有些艰难,但靠着自己的努力,还是可以维持每天生活的开销。平凡简单还是我们大部分 90 后生活的基调。但我们 90 后都有一个共同的回忆:我们见证了腾讯的崛起。
第一个 QQ 号
你还记得第一个 QQ 号是怎么获得的吗?我是非常清楚的记得。那时候电脑不像如今如此的普及,甚至随着最近几年移动互联网的崛起,许多人都很久没有再碰过电脑。一部智能手机就足以满足日常生活的各个方面。
10 年前我还在读初中,而我第一个 QQ 号是叫死党小白帮我注册的。班里一共 50 几个人,但拥有电脑的人数却少之又少。我们班就只有 3 个人有,而且都是大屁股台式机。其中一个就是小白,我非常要好的朋友。
那时 90 后们正值青春期,刚上中学,上 QQ 找人聊天是一种非常潮流的事。如果你能拥有一个 QQ 号那是相当牛逼的事。而大部分人又没电脑注册不了怎么办?所以我们班没有 QQ 号的同学,都是叫拥有大屁股的小白,帮忙一起注册一个。
现在偶尔跟小白聊聊天,都会提起以前的事:“第一批 QQ 开放的时候,我们都还在读初三,还是半夜 12 点放出一点 QQ 号大家都在抢。你们一个个都叫我帮你们抢,可把我给累的,你们说要怎么报答这些年的恩情”。当小白跟我说成功注册,那个兴奋啊!随后加了非常多的人,看着谁在线就跟谁聊天。
等我上了高中,翻盖手机慢慢开始流行起来。那时候如果能拥有一部步步高的翻盖手机是非常了不起的事。以前的手机流量不像现在如此的多,以前一个月才 30M,但却可以使用很久。甚至一个月的时间,你还用不完这 30M 的流量。每天我也就使用手机登登 QQ,看下自己喜欢的人是否在线。每次听到 QQ 好友滴滴上线的声音,总是非常的兴奋,总是认为自己心仪的人上线了,内心的小鹿一直乱撞。再者就是玩玩开心农场、停车位。根本就用不完。那像现在,打开一个微信群,几百 M 的流量就没了。
第一条空间说说
你的第一条空间说说还记得发的是什么内容吗?我第一条空间说说是在 2011 年 1 月 20 日,内容如下。
发了个 I?回看自己第一条说说的内容,我的脑海第一个反应是黑人问号,对就是下面这样的。
我早已忘记以前是怎么想的,第一条说说就这样奉献出去,但却非常的开心。这都是青春最好的痕迹,想想以前的快乐是多么容易满足啊,有 QQ 好友上线提示声你会非常的激动,每天都在忙着偷别人家的菜,停车位总想用最高的价钱把自己心仪的人买过来,好像你就拥有了她。而如今早已失去这种快乐,你有多久没有打开 QQ 了?你还记得第一条空间说说是什么吗?欢迎在评论区留言,看看曾经的自己。
爬取 QQ 空间说说的内容
今天我就带大家来实现一个 QQ 空间爬虫程序,爬取你朋友说说的内容。看看你的 QQ 好友这些年在空间都发了那些说说,他的青春痕迹又是如何。当然运行这个爬虫程序是有一个前提,要你的账号可以访问 QQ 好友的空间。如果你被好友屏蔽了,程序是抓取不到内容的。
我使用的是 Python 3.6 版本,运行这个程序需要你先安装好相应的库。其中很重要的一个库「Selenium」是必须安装的。程序只有一个 text() 函数,有三个参数:friend、user、pw。分别对应着你的 QQ 好友号,你自己的 QQ 账号,以及你的 QQ 密码。
「Selenium」是用于自动化测试工具,它是在 Apache 许可证 2.0 许可的开放源代码工具。「Selenium」是一套工具,它有助于自动化 Web 应用程序测试。
text () 函数可以分为两部分来理解,第一部分初始化 webdriver.Chrome()。即下面所示的代码。
第二部分开始抓取对应好友全部的说说内容,即下面的代码部分。
每段代码都有详细的注释,大家可以自己去下载查看。
运行完程序以后,会把爬取到的说说内容全部保存到「qq_word.txt」文本中。满满的都是青春的回忆。
制作词云
然后我在把爬取的内容,通过 wordcloud、jieba 制作一个词云。代码如下:
最后制作的词云
哈哈哈,非常的符合我朋友的性格。她在现实中也是一个非常爱笑的女生。你的青春回忆又是什么?快去自己动手爬取下吧。
领取专属 10元无门槛券
私享最新 技术干货