当您使用lxml库解析XML文档时,可以使用etree.XMLParser
来删除<?xml ...>
标签。以下是一个示例代码:
from lxml import etree
# 假设您的XML文档如下
xml_string = '''<?xml version="1.0"?>
<root>
<child>text</child>
</root>
'''
# 使用XMLParser解析XML文档
parser = etree.XMLParser(remove_blank_text=True, remove_comments=True, remove_pis=True)
tree = etree.fromstring(xml_string, parser)
# 将解析后的XML文档转换为字符串
xml_string_without_pi = etree.tostring(tree, pretty_print=True).decode()
print(xml_string_without_pi)
输出结果:
<root>
<child>text</child>
</root>
在这个示例中,我们使用etree.XMLParser
设置了remove_pis=True
,这将删除<?xml ...>
标签。同时,我们还设置了remove_blank_text=True
和remove_comments=True
,以删除空白文本和注释。最后,我们将解析后的XML文档转换为字符串,并打印出来。
领取专属 10元无门槛券
手把手带您无忧上云