任务: 将数据存放到temp.csv 链接: 1.排行页面 https://www.dongchedi.com/sales 2.参数页面 https://www.dongchedi.com/auto/params-carIds-x-9824 完善打印: 1. [{‘series_id’: 5952, ‘series_name’: ‘海鸥’, ‘image’: ‘https://p3-dcd.byteimg.com/img/tos-cn-i-dcdx/e33ad9ed8d9749a28fed202afadcd900~tplv-resize:640:0.png’, ‘rank’: 1, ‘min_price’: 6.58, ‘max_price’: 8.58, ‘last_rank’: 1, ‘count’: 56156, ‘sub_brand_name’: ‘比亚迪’, ‘price’: ‘6.58-8.58万’,} 操作步骤: 1.完善上次的内容输出;sub_brand_name rank 2.发现还有4个没有加上去,在参数页面;https://www.dongchedi.com/auto/params-carIds-x-9824 3.是将数据存放到csv文件,用carData[]列表存放数据;需要定义一个列表; 局部代码:
for index,car in enumerate(pageJson):
print('正在爬取第%d'%(index+1)+'条数据')
#定义一个列表文件
carData=[]
carData.append(car['brand_name'])
carData.append(car['series_name'])
carData.append(car['image'])
carData.append(car['count'])
carData.append(car['min_price'])
carData.append(car['max_price'])
carData.append(car['sub_brand_name'])
carData.append(car['rank'])
#测试:打印列表内容,看下顺序是否和temp.csv字段一致;
print(carData)
break利用xpath技术的分析
4.分析页面



对应的“中型车”的文本信息