python界也有个类似于我们iOS开发里cocoapods的东西,这个东西叫做pip.
pip和cocoapods用起来的命令都极其类似,我们只需要两个库,一个叫做urllib2,一个叫做Beautifulsoup...它的作用就是把网页down下来,然后你就可以分析网页了.
Beautifulsoup干什么的呢?...re的python库,另一个是使用lxml解析xpath.这两个说实话都不太好用,一个正则就够你吃一壶的.后来我搜索了很久,发现了一个库叫做Beautifulsoup,用这个库解析html超级好用....再仔细分析下,img这个标签在li这个标签里有且只有一个.那么,也就是说,我们先搜索出所有符合条件的li标签,然后找到里面的img标签就可以找到所有的图片链接了.
然后看代码....我们获取了网页的html之后呢,声明了一个Beautifulsoup变量soup,用来准备解析html.
liResult = soup.findAll('img',attrs={"width":"175