从etree对象获取原始文本可以通过以下步骤实现:
from lxml import etree
tree = etree.parse('example.xml')
这里的'example.xml'是XML文档的文件路径,你需要将其替换为你实际使用的XML文件。
root = tree.getroot()
text
属性获取原始文本:text = root.text
这将返回根元素的原始文本。
需要注意的是,如果根元素包含子元素,那么text
属性只会返回根元素的文本内容,而不包括子元素的文本。如果你需要获取包括子元素在内的所有文本内容,可以使用etree.tostring()
方法将etree对象转换为字符串,并使用字符串处理方法提取所需的文本。
这是一个简单的示例,你可以根据实际情况进行调整和扩展。如果你需要更多关于etree对象的操作和用法,可以参考腾讯云的相关文档和教程:
领取专属 10元无门槛券
手把手带您无忧上云