or 3.2.2)前 的版本中文档容错能力差
lxml HTML 解析器 BeautifulSoup(markup, "lxml") 速度快
文档容错能力强 需要安装C语言库
lxml XML 解析器...BeautifulSoup(markup, ["lxml", "xml"])
BeautifulSoup(markup, "xml") 速度快
唯一支持XML的解析器 需要安装C语言库
html5lib...C语言库
lxml XML 解析器 BeautifulSoup(markup, ["lxml", "xml"])
BeautifulSoup(markup, "xml")
速度快
唯一支持...XML的解析器
需要安装C语言库
html5lib BeautifulSoup(markup, "html5lib")
最好的容错性
以浏览器的方式解析文档
生成HTML5格式的文档
速度慢...使用BeautifulSoup解析上述代码,能够得到一个 BeautifulSoup 的对象,并能按照标准的缩进格式的结构输出
from bs4 import BeautifulSoup
soup=BeautifulSoup