忽略Beautifulsoup Find_All中的重复项

、、

下面是我到目前为止所做的一个例子： soup = BeautifulSoup(html, 'html.parser').find_all()输出：INSIDE TAGLIST2 OUTSIDE T

浏览 8提问于2017-02-04得票数 2

回答已采纳

1回答

BeautifulSoup和if/else语句

、

A我正在学习如何使用BeautifulSoup，我在我写的循环中遇到了一个双重打印的问题。import requests data = r.text

浏览 13提问于2017-12-16得票数 0

1回答

BeautifulSoup find_all返回重复项

、、

我正在尝试获取有关期刊文章的元数据；具体地说，就是每篇文章属于期刊的哪个部分。我使用find_all首先获取带有文章标题的所有标签，然后使用它解析带有文章部分和url信息的标签。例如，如果某一期有42篇文章，而不是输出中的42行，每行代表该期中的不同文章，我只获得该期中最后一篇文章的数据，在输出中重复了42次。我在代码中忽略了什么，以确保输出实际上包含这些问题中每

浏览 38提问于2019-08-01得票数 0

回答已采纳

1回答

使用Python BeautifulSoup函数返回重复项

、、、

我试图使用以下代码从以下网站中刮取数据：data =urllib2.urlopen(url)exercises = soup.find("div", {"id":"listResults"}).fin

浏览 2提问于2014-01-02得票数 0

回答已采纳

1回答

如何在BeautifulSoup中捕获此异常

、

可能重复： for item in soup.find(id="start_dateid").find_all('option'):问题是当页面没有id="start_datei

浏览 4提问于2012-12-09得票数 0

回答已采纳

1回答

Python抓取fetech href链接

、

gr-hyperlink" href="/genres/art">Art</a>,这是我的密码import numpy as npfrom urllib import urlopen from bs4 import Beauti

浏览 2提问于2020-07-12得票数 0

回答已采纳

2回答

用Python 3进行抓取

、

Python3:我是刚开始刮擦和训练的，我正在尝试从这个页面中获得所有的功能： import requests response = requests.get(url)soup = BeautifulSoup

浏览 0提问于2019-01-06得票数 1

回答已采纳

2回答

BeautifulSoup中"findAll“和"find_all”的区别

、、、

我想用Python解析一个HTML文件，我使用的模块是BeautifulSoup。import urllib, urllib2, cookielibsite = "http://share.dmhy.orgteam_id%3A407" r

浏览 5提问于2012-09-09得票数 39

回答已采纳

1回答

Python刮板打印问题

、、

我已经在python中创建了一个web刮刀，但是在最后打印时，我想打印("Bakerloo：“+ info_from_website)，正如您在代码中看到的那样，但是它总是以info_from_website的形式出现，忽略了"Bakerloo：”字符串。反正也找不到解决问题的办法。import urllibfrom bs4 import BeautifulSoup url = 'http

浏览 4提问于2016-09-02得票数 1

回答已采纳

3回答

使用BeuatifulSoup提取除其他标签外的div标签的内容

、

HTML内容，其中div标签看起来像下面 <div class="block">aaa <p> ccc</p> </div> 从上面我想提取文本只作为"aaa“，而不是其他标签的内容当我这么做的时候 soup.find('div', {"class": "block"}) 它为我提供了文本形式的所有内容，我希望避免使用p标

浏览 35提问于2020-11-17得票数 0

回答已采纳

2回答

Python美汤如何在ul中找到李？

、

soup.find("ul",attrs={"class":"clearfix"}): print(durum) 我想用BeautifulSoup在ul中使用li，所以我写了这个命令，但是我得到了一个错误的'NavigableString' object has no attribute 'find_all'。

浏览 25提问于2021-01-16得票数 0

回答已采纳

2回答

检索Python网页中的所有字符串

、

我试图使用BeautifulSoup从网页中检索所有字符串，并返回所有检索到的字符串的列表。查找所有具有非空文本的元素，将文本追加到结果列表并返回它。我很难实现这一点，因为我无法在BeautifulSoup中找到任何方法来实现它。使用BeautifulSoup的" find_all“方法查找我正在寻找的所有属性，如"p”表示段落，"a“表示链接等。这种方法面临<

浏览 2提问于2021-11-24得票数 0

回答已采纳

1回答

BeautifulSoup4 - AttributeError：“ResultSet”对象没有属性“”text“”

、、

import requestsfrom bs4 import BeautifulSoup r =requests.get(url) g_data = soup.find_all=re.compile("/fighter"))

浏览 0提问于2017-01-16得票数 0

3回答

使用从URL中刮取列表

、

我是BeautifulSoup的新手，所以请原谅这里任何初学者的错误。我试图刮一个网址，并希望存储的电影列表下的一个日期。下面是我到目前为止拥有的代码：from bs4 import BeautifulSoup page = requests.get("https://www.imdb.com您可能是将一个项目列表当作单个项来处理。当您打算调用find_all()时，是否调用了fi

浏览 1提问于2020-05-29得票数 0

回答已采纳

2回答

如何在python脚本中导入.py

、

我试图在python脚本中直接导入BeautifulSoup库，但我无法安装它，因为我在语法DS213+中使用它，所以我尝试这样做： soup = BeautifulSoup(html) for link in soup.find_all('a'):line 17, in <module> sou

浏览 3提问于2014-02-24得票数 0

回答已采纳

1回答

BeautifulSoup文档中给出的不工作的示例

、

我正在尝试BeautifulSoup文档中给出的示例，其中一个例子是没有给出预期的结果。</p>soup = BeautifulSoup(html_doc)soup.find_all('b')但是，当

浏览 3提问于2015-01-19得票数 1

回答已采纳

1回答

BeautifulSoup中文本和字符串的区别

、

当我搜索BeautifulSoup中包含特定文本的标记时，我使用find_all(string='text I want')soup.find_all(string='stackoverflow')soup.find_all(text='stackoverflow&#x

浏览 4提问于2016-03-26得票数 1

回答已采纳

1回答

如何从我的函数调用导入库的函数？

在尝试使用BeautifulSoup从某些网页获取信息时，有许多重叠的代码，因此我想将其作为一个函数，但我想在bs中调用一个函数，比如find_all和select。我该怎么做呢？import requests soup = BeautifulSoup(result.text, &quo

浏览 4提问于2022-07-01得票数 0

回答已采纳

1回答

BeautifulSoup不会刮掉所有数据。

、、

我试图刮一个网站，但当我运行这段代码时，它只打印一半的数据(包括批评者的数据)。这是我的剧本：from urllib.request import urlopen foid=4106228"soup = BeautifulSoup(html, "html.parser") page_details

浏览 4提问于2017-09-14得票数 0

回答已采纳

3回答

BeautifulSoup `find_all`发生器

、、

有没有办法把find_all变成一个内存效率更高的生成器？例如：soup = BeautifulSoup(content, "html.parser")我想代之以： soup = BeautifulSoup这里有一些内置的生成器，但不会在查找中产生下一个结果。find只返回第一项。有了成千上万的条目，find_all吸收了大量的</em

浏览 6提问于2016-12-29得票数 6

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BeautifulSoup和if/else语句

BeautifulSoup find_all返回重复项

使用Python BeautifulSoup函数返回重复项

如何在BeautifulSoup中捕获此异常

Python抓取fetech href链接

用Python 3进行抓取

BeautifulSoup中"findAll“和"find_all”的区别

Python刮板打印问题

使用BeuatifulSoup提取除其他标签外的div标签的内容

Python美汤如何在ul中找到李？

检索Python网页中的所有字符串

BeautifulSoup4 - AttributeError：“ResultSet”对象没有属性“”text“”

使用从URL中刮取列表

如何在python脚本中导入.py

BeautifulSoup文档中给出的不工作的示例

BeautifulSoup中文本和字符串的区别

如何从我的函数调用导入库的函数？

BeautifulSoup不会刮掉所有数据。

BeautifulSoup `find_all`发生器

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐