同样本篇博客,小菌将继续分享实用的爬虫—获取豆瓣电影Top250的内容,并保存在MySQL数据库中。...URL的函数
html = requests.get(url, headers=headers)
selector = etree.HTML(html.text)
movie_hrefs...def get_movie_info(url): # 定义获取详情页信息的函数
html = requests.get(url, headers=headers)
selector...,想获取里面的文本值,可以使用string(.)...声明:
在爬虫过程中,出现了IndexError的错误,这是因为有些电影的链接已经不存在了,这里通过try()函数来处理异常,以使爬虫程序继续运行而不报错!