我正在使用BeautifulSoup从网站抓取文本,但我只需要用于组织的<p>标记。但是,我不能使用text.findAll('p'),因为还有其他我不需要的<p>标记。我想要的文本都被包装在一个标记中(假设是body),但是当我解析它时,它也需要包含该标记。link = requests.get('link')
te
这是我第一次使用网络抓取。到目前为止,我能够导航并找到我想要的HTML部分。我也可以打印出来。问题是只打印文本,这将不起作用。当我尝试它时,我得到了以下错误:AttributeError: 'ResultSet' object has no attribute 'get_text'from bs4 importBeautifulSoup
i