导语
利用Python简单分析一下Chrome浏览器的网页浏览记录,感觉蛮有意思的。记得很久以前在哪看到过这个创意,应该是国外哪个小哥想的,一时间找不到了,回头看到再在评论区补上参考文献好了。废话不多说,让我们愉快地开始吧~
开发工具
Python版本:3.6.4
相关模块:
pyecharts模块;
wordcloud模块;
以及一些Python自带的模块。
DB.Browser版本:3.11.0
环境搭建
关于python:
安装Python并添加到环境变量,pip安装需要的相关模块即可。
关于DB.Browser:
下载地址:
https://github.com/sqlitebrowser/sqlitebrowser/releases
建议下载免安装版本的(相关文件中也提供了免安装版本)。
原理简介
Chrome浏览器的网页浏览历史记录一般保存在:
C:\Users\\AppData\Local\Google\Chrome\UserData\Default\history
利用DB.Browser打开它,发现与历史浏览记录相关的表有urls和visits:
打开观察一下表的结构:
了解了表的结构之后,我们就可以愉快地写代码提取历史浏览记录了:
将获取到的数据进行简单的可视化,结果如下:
All done!完整源代码详见相关文件。
○
○
Charles的皮卡丘
Pikachu~
领取专属 10元无门槛券
私享最新 技术干货