冯大辉老师在程序员圈子中还是比较出名的,大部分都知道他这个人,性格很鲜明。他现在正在创业,公司叫无码科技,他有一个公众号叫小道消息,新榜给的活跃粉丝是30多万数据,他的微博有180万粉,这说明冯老师在科技界还是很有影响力的。
事情是这样的,上周的一天公众号又照例收到了大辉老师的文章,我就在他的文章底下留言了,说要爬爬他的文章。
这是我用冯老师最近5000多条微博内容做的词云,大家可以围观一下。
之前也写了一篇用python 来爬取朋友的QQ说说,大家也可以围观一下
好了,开始进入正题:
特别注意一下,生成词云的代码在github上文件中,调用方法就行了。
其它补充的文字也没有什么要说的,注释都在代码中,接下来要使用Scrapy爬虫框架了,虽然快过年了,但学习还是不能停下来。
领取专属 10元无门槛券
私享最新 技术干货