前面我们把大量数据已经爬取到了本地,但这些数据如果不存储起来,那么就会变得无效.开始本文之前,请确保已经阅读。
我们已经把数据爬到本地并已经插入execl,上效果图
操作Execl其实里面很多东西要去了解,但这里我讲常用的读写,满足我们的一般需求,感兴趣的朋友可以自己去深入。
1. 读execl文件
需要安装 xlrd库,老办法,直接在setting中安装,然后导入放可使用python读取execl
操作这样的execl列表
很简单没有什么要解释的了
2. 复习一下range函数
3. 写入execl
需要安装xlwt库,老办法自己先安装,不多说了,需要导入xlwt然后放可使用python写入数据
完整实例代码
最后得到的效果图
3. 把爬取的猪八戒数据插入到execl中
这里直接上代码了,相关的注释都在代码里
最后的效果图是:
注意这里爬取数据的时候,有的代理ip还是被禁用了,所以获取数据有失败的情况,所以这里需要有异常处理..
当然数据还应该存入到数据库中,所以下一篇我们会来讲讲如何把数据插入到数据库中。
领取专属 10元无门槛券
私享最新 技术干货