没有更多BeautifulSoup - 腾讯云开发者社区

、、、

我试图从一个IMDB电影链接的网络刮评论和提取评论的用户名，我只得到25个用户名，因为这是页面显示，直到你按下“显示更多”。ref_=tt_urv'responsesoup=bs4.BeautifulSoup(response.content

浏览 2提问于2020-10-30得票数 1

2回答

为什么BeautifulSoup没有找到所有的标签？

、

当我使用BeautifulSoup 4解析，然后查找表标记时，它会找到2。当我查看页面的html时，我会看到10个表。为什么BeautifulSoup不返回全部10个？from bs4 import BeautifulSoup soup = BeautifulSoup(page) print len(soup.find

浏览 3提问于2014-01-15得票数 0

回答已采纳

3回答

如何使用BeautifulSoup从网页中读取更多内容来抓取评论

、、

我试图从一个网站刮评论，并没有能力刮评论有一个‘读更多’选项。我只能在阅读更多之前才能得到数据。我正在使用BeautifulSoup。任何帮助都是非常感谢的。

浏览 1提问于2017-08-17得票数 0

1回答

从一个单一页面的网站获取与BeautifulSoup的所有链接(“加载更多”功能)

、、、

我想刮所有的链接，从一个网站，没有分页，即，有一个‘加载更多’按钮，但网址不改变取决于多少数据，你已经要求。当我BeautifulSoup的网页，并要求所有的链接，它只是显示的数量的链接在香草第一页的网站。我可以通过单击“加载更多”按钮来手动单击旧的内容，但是有一种以编程方式这样做的方法吗？这就是我的意思：soup = soup = <

浏览 1提问于2016-03-07得票数 1

回答已采纳

1回答

不能把所有的评论都刮掉

、、、

要加载更多，您必须单击“显示更多的评论”，我不知道如何获得所有的数据，因为没有页面链接，而且“显示更多的评论”没有一个URL去探索，地址保持不变。url = "“ from bs4 import BeautifulSoupimport pandas as pdhtml = url.text soup = BeautifulSoup(h

浏览 1提问于2019-06-01得票数 1

回答已采纳

1回答

我在jupyter笔记本上安装了BeautifulSoup4。尝试使用"from bs4 import BeautifulSoup“时出现错误

、、、

selenium.webdriver.chrome.service import Service from bs4 import BeautifulSoup

浏览 7提问于2022-09-24得票数 0

1回答

or或Selenium不会单击按钮或链接

、、、、

我正在抓取一个名为skechers的运动鞋网站，现在当LOAD MORE链接/按钮出现时，向下滚动以加载更多产品，它单击该元素但没有加载。下面是我的代码：import time time.sleep(10)

浏览 0提问于2021-03-14得票数 0

3回答

如何抓取页面中未加载的内容？

、、、

但是页面并没有完全加载。在页面的底部是按钮"Pokażwięcej“，这意味着显示更多。如果我点击它，它会加载更多的关注点。这个脚本只抓取了第一部分。我怎么才能刮掉整个列表呢？import requestsurl = "https://www.gpw.pl/spolki" soup = BeautifulSoup(respon

浏览 0提问于2020-04-28得票数 0

1回答

如何用Python，BeautifulSoup构建子树？

、

我正在尝试使用BeautifulSoup编写网页。当我通过string设置标记的内部内容时，它会自动转义字符串。我还没有找到一种技术，比如html方法/属性，其中BS不会自动转义所有东西。from bs4 import BeautifulSoup soup = BeautifulSoup(f.read(), 'html.parserdiv>example</div>&qu

浏览 13提问于2019-06-24得票数 0

回答已采纳

4回答

涉及具有属性的HTML标记的Python web抓取

、、、

除此之外，我不确定是应该更多地依赖BeautifulSoup还是lxml，还是两者的组合。我该怎么办？import BeautifulSoup, NavigableString html = urllib2.urlopen(address).read() html=soup.prettify() html=htm

浏览 0提问于2009-09-08得票数 8

回答已采纳

1回答

如何使用python和漂亮的汤抓取所有事件的位置

、

链接：import requestspage = requests.get(URL) soup = BeautifulSoup(page.conten

浏览 7提问于2021-08-17得票数 0

回答已采纳

1回答

我正在尝试从如下格式的页面中解析一个名为secu的值：https://www.ariva.de/[WKN-input]/historische_kurse 我可以在查看页面的源代码中找到： <input type="hidden" name="secu" value="717816" /> 例如：https://www.ariva.de/A0D9PT/historische_kurse 最后，我想将其存储到CSV中。这是我已经有的代码，缺少解析部分： import pandas as pd # read WKN names fr

浏览 22提问于2021-01-20得票数 0

回答已采纳

3回答

使用BeautifulSoup4查找包含文本的所有终端节点。

、、

我是Python和BeautifulSoup4的新手和content = soup.find_all(tags, text=True, recursive=False) 这两个都没有输出编辑-添加更多代码和我正在测试的

浏览 1提问于2019-01-19得票数 5

回答已采纳

1回答

findAll返回空的html

、、、、

我正在使用BeautifulSoup模块解析一个html文件，我想从中提取某些信息。特别是比赛分数和球队名称。import urllibimport refrom bs4 import BeautifulSoup

浏览 3提问于2017-05-12得票数 1

2回答

在Beautiful Soup中添加文本到p标签

、、、

文档中没有提到在哪里可以做到这一点。

浏览 6提问于2010-02-18得票数 6

3回答

通过bs4打印刮过的网页时出错

、、、、

代码：import urllibsoup = BeautifulSoup(page1) print(soup.get_text())

浏览 3提问于2015-01-07得票数 1

回答已采纳

1回答

AttributeError：'str‘对象在使用BeautifulSoup时没有属性’子代‘错误

、、

@ayivima在下面有一个很好的答案，但我要补充的是，网站本身最终没有被BeautifulSoup正确地刮掉，因为它有大量的Javascript。。我使用的代码主要来自google：import requests page = requests.get(url)soup = Beautifu

浏览 0提问于2019-06-24得票数 2

2回答

如何抓取与某一期刊/文章的每一位教授相关的附属关系

、、、、

在单击“显示更多的”按钮后，该从属关系将可用。我可以点击它，但我不能刮的从属关系，这是加载后点击显示更多的按钮，这里是代码。for循环没有打印包含从属关系的dl-标记。from selenium import webdriver driver.get('https://www.s

浏览 4提问于2019-11-14得票数 1

回答已采纳

3回答

如何使用BeautifulSoup* Python在web上浏览“显示更多”按钮？*

、、

我在python上使用BeautifulSoup从这个网站上获取足球统计数据：https://www.skysports.com/premier-league-results/2020-21。然而，该网站只显示了本赛季的前200场比赛，而180场比赛的其余比赛都在“显示更多”按钮后面。该按钮不会更改url，因此我不能简单地替换url。这是我的代码： from bs4 import BeautifulSoup scores_html_text = requests.ge

浏览 48提问于2021-09-09得票数 2

2回答

“NoneType”对象在获取google结果时没有属性“text”

、、、

在这篇文章中，我询问了更多关于如何在日期范围内从谷歌获得结果的信息，但结果被关闭为重复。不幸的是，所建议的另外两项结果并没有解决我在获得这个数字方面的问题。使用以下代码：from bs4 import BeautifulSoup print (soup.find('div',{'id':'resultStats'}).text) 我

浏览 9提问于2020-03-08得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BeautifulSoup-访问更多评论

为什么BeautifulSoup没有找到所有的标签？

如何使用BeautifulSoup从网页中读取更多内容来抓取评论

从一个单一页面的网站获取与BeautifulSoup的所有链接(“加载更多”功能)

不能把所有的评论都刮掉

我在jupyter笔记本上安装了BeautifulSoup4。尝试使用"from bs4 import BeautifulSoup“时出现错误

or或Selenium不会单击按钮或链接

如何抓取页面中未加载的内容？

如何用Python，BeautifulSoup构建子树？

涉及具有属性的HTML标记的Python web抓取

如何使用python和漂亮的汤抓取所有事件的位置

使用python解析互联网页面中的特定值

使用BeautifulSoup4查找包含文本的所有终端节点。

findAll返回空的html

在Beautiful Soup中添加文本到p标签

通过bs4打印刮过的网页时出错

AttributeError：'str‘对象在使用BeautifulSoup时没有属性’子代‘错误

如何抓取与某一期刊/文章的每一位教授相关的附属关系

如何使用BeautifulSoup* Python在web上浏览“显示更多”按钮？*

“NoneType”对象在获取google结果时没有属性“text”

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐