前言:
在掌握一些基础的爬虫知识后,就可以尝试做一些简单的爬虫来练一练手。今天要做的是利用xpath库来进行简单的数据的爬取。我们爬取的目标是电影的名字、导演和演员的信息、评分和url地址。...lxml.html.etree
temp = r'C:\Users\86177\Desktop'+'\\'+'doubanmovie'
with open(temp + '.csv', 'w') as f:
csvwriter...= csv.writer(f, dialect='excel')
csvwriter.writerow(['title','info','average','link'])
header...print(a, b, c, d)
with open(temp + '.csv', 'w') as f:
csvwriter...= csv.writer(f, dialect='excel')
csvwriter.writerow([a, b, c, d])
总结:
这次爬取豆瓣的反爬虫机制较少