Python默认的解析器,lxml 解析器更加强大,速度更快,推荐安装
解析器 使用方法 优势 劣势
Python标准库 BeautifulSoup(markup, “html.parser”) 1....方法前,先介绍一下过滤器的类型 ,这些过滤器贯穿整个搜索的API.过滤器可以被用在tag的name中,节点的属性中,字符串中或他们的混合中
# 5.1.1 字符串
最简单的过滤器是字符串.在搜索方法中传入一个字符串参数...'))
# 5.1.4 True
True 可以匹配任何值,下面代码查找到所有的tag,但是不会返回字符串节点
# 5.1.5 按CSS搜索
按照CSS类名搜索tag的功能非常实用,但标识CSS类名的关键字...class 在Python中是保留字,使用 class 做参数会导致语法错误.从Beautiful Soup的4.1.1版本开始,可以通过 class_ 参数搜索有指定CSS类名的tag
# 返回class...等于info的div
print(soup.find_all('div',class_='info'))
# 5.1.6 按属性的搜索
soup.find_all("div", attrs={"class