BeautifulSoup(markup, ["lxml", "xml"])
BeautifulSoup(markup, "xml") 速度快
唯一支持XML的解析器 需要安装C语言库
html5lib...BeautifulSoup(markup, "html5lib") 最好的容错性
以浏览器的方式解析文档
生成HTML5格式的文档 速度慢
不依赖外部扩展
Python的内置标准库
执行速度适中
文档容错能力强...XML的解析器
需要安装C语言库
html5lib BeautifulSoup(markup, "html5lib")
最好的容错性
以浏览器的方式解析文档
生成HTML5格式的文档
速度慢...: #去掉空白
print(line)
'''
如果tag包含了多个子节点,tag就无法确定 .string 方法应该调用哪个子节点的内容, .string 的输出结果是 None,如果只有一个子节点那么就输出该子节点的文本...find_all() 方法的返回结果是值包含一个元素的列表,而 find() 方法直接返回结果.
find_all() 方法没有找到目标是返回空列表, find() 方法找不到目标时,返回 None