当使用BeautifulSoup时，在某些搜索结果中，html需要不同索引号中的数据

、、、

我有一个网站的格式问题，导致容器内的某些信息从一个搜索结果到下一个搜索结果具有不同的索引号。我正在从搜索结果中抓取数据。位置/索引号在少数情况下是不同的。基本上，我需要从下面的html中抓取的确切文本是&quo

浏览 19提问于2019-02-19得票数 1

回答已采纳

1回答

为什么通过漂亮汤导入的html与实际的html不同？

、

嗨，我正在制作一个程序，它在堆栈溢出中为搜索词抓取结果。我需要知道抓取的最大页面，但是通过开发工具查看的html结构和通过漂亮汤获得的html信息是不同的。from bs4 import BeautifulSoupurl = "https:&#

浏览 1提问于2020-08-30得票数 1

1回答

如何设置BeautifulSoup以避免错误结果？

、、

在使用BeautifulSoup的过程中，我发现很多情况下，所查找的信息肯定在HTML中，但BeautifulSoup却找不到。这是一个问题，因为在某些情况下，信息不在那里，所以不可能知道BeautifulSoup的搜索结果是失败的情况，还是信息根本不存在的真实情况。与此形成鲜明对比的

浏览 3提问于2014-07-15得票数 0

1回答

Python POST请求

、

我正在使用python请求搜索以下站点：搜索术语“耐用品订单US”所以我试着用pythondata, headers={ 'User-Agent': 'Mozilla/5.0', 'X-Requested-With': 'XMLHttpRequest'}

浏览 4提问于2017-04-18得票数 0

回答已采纳

1回答

Beautifulsoup功能在特定场景下不能正常工作

、、、

我正在尝试使用urllib2：读取以下url，然后搜索元重定向的数据。 <!0;url= Home.html" http-equiv="refresh"/></head><body></body></<em

浏览 5提问于2013-04-22得票数 2

回答已采纳

4回答

使用Python下载URL的html* -但启用了javascript*

、

我正在尝试下载，这样我就可以抓取搜索结果。但是，当我下载页面并尝试使用BeautifulSoup处理它时，我发现页面的某些部分(例如，搜索结果)没有包括在内，因为网站检测到javascript没有启用。有没有办法在Python中启用javascript的情况下下载URL的HTML？

浏览 0提问于2011-07-09得票数 1

回答已采纳

1回答

课堂上的BeautifulSoup查找不起作用

、、

将文本打印到控制台给我 <body> }" <div class='\"message-container但是，当我试图提取消息容器div时，我会得到一个空列表。messageContainers = BeautifulSoup(post).findAll('div',attrs={'class':'

浏览 2提问于2015-02-19得票数 0

回答已采纳

1回答

BeautifulSoup将单引号替换为双引号

、

在Python的BeautifulSoup4中，如果我执行以下命令：print soup澄清：我使用urllib2获取以下页面的html：http://www.download3000.com/，然后使用<em

浏览 1提问于2013-07-22得票数 4

2回答

为什么BeautifulSoup在第二次解析时工作，而不是第一次解析？

、、

span class="text-default">CN</span><span class="text-default text-darker">XMN</a>为了在title之后提取title，我无法使用a[0].find('div')['title] (其中a是上面的BeautifulSoup ResultSet)。text-

浏览 1提问于2016-10-11得票数 2

回答已采纳

1回答

在Solr中分页是否需要排序？

在某些数据库中，如果不包括查询中的排序，数据库可能每次以不同的顺序访问相同的查询结果。因此，如果通过发送具有不同起始位置的多个查询进行分页，则可能会多次得到相同的raws。索尔也是这样吗？如果我通过更改start参数来迭代所有文档，是否需要包含一些排序字段？

浏览 1提问于2016-02-03得票数 0

回答已采纳

3回答

如何将文本值标记更改为cdata节

、

我通过将dataset绑定到XMLDocument对象来基于dataset生成XMLDocument，然后在vb.net中将其显示给用户。我要求某些标签包含cdata部分而不是文本值。在生成XMLDocument之后，如何仅将特定的标记更改为cdata部分，并保持所有其他标记不变？或者，有没有一种方法可以在绑定本身的同时进行修改？

浏览 2提问于2008-11-06得票数 0

回答已采纳

1回答

(10) html2 = driver.page_source time.sleep= BeautifulSoup(html2，"lxml"，from_encoding="utf-8") div = soup.find_all从我自己的研究来看，这似乎是通过javascript动态加载数据的一个问题，并且只有bs4？()解析了被推到html的内容。任何提供建议的人都很难在没有在网站上创建配置文件

浏览 3提问于2016-01-13得票数 5

1回答

如何使用BeautifulSoup解析javascript内容

、、、、

我很难在HTML中解析一些变量<script type="text/javascript"> var controller = "my-account"

浏览 8提问于2022-03-08得票数 -1

1回答

使用Python阅读网页搜索结果

、、

我希望能够生成某些类型的网络搜索匹配的自动警报。第一步是在Python中读取url，这样我就可以使用BeautifulSoup或其他基于正则表达式的方法来解析它。但是，对于下面示例中的页面，当我使用浏览器打开页面时，html不能捕获我正在可视化的结果。有没有一种方法可以真正获得包含搜索

浏览 1提问于2015-09-11得票数 0

3回答

相同的CSS，不同的结果在浏览器和bs4 .select()方法

、、、

我正在尝试从以下网页检索一些信息：selector = 'body > table:nth-of-type(2) > tbody:nth-of-type(1)>tr:nth-of-type(1)>td:nth-of-type(5)>table:nth-of-type(1)>tbody:nth-of-type(1)'impor

浏览 0提问于2018-12-14得票数 1

2回答

对预填充solr的只读访问

我对apachesolr/solr/drupal是新手，所以请耐心点(：我如何搜索我的数据？当我去的时候我可以看

浏览 0提问于2015-03-09得票数 2

1回答

从DOM解析HTML* (非静态HTML)*

、、、

当我尝试从DOM中解析HTML数据时，当我使用Chrome的开发工具时，我可以在控制台中看到这些数据。当我在本地将页面另存为HTML并搜索目标数据时，无法找到它。我已经阅读了一些关于浏览器如何接收静态HTML文件，以及Javascript如何以不同的方式呈现它的内容。具体<e

浏览 1提问于2012-12-16得票数 0

回答已采纳

3回答

如何在jrunscript或jjs中访问标准输入(在win7上)

、、

我在谷歌上搜索了很多，但没有找到任何东西告诉我在使用jrunscript执行JS时如何访问stdin。>cat file | jrunsscript -f apply-regex.js ..。然后输出结果(我可以通过管道将结果保存到一个文件中

浏览 0提问于2016-01-14得票数 1

3回答

在没有Twitter API的情况下根据Hashtag抓取历史推文

、、、、

我有一个网络爬行器，给出一个标签，将返回带有该标签的推文。我遇到的问题是，当我向twitter请求获取标签时，我只收到了大约20条tweet。我使用请求来发出请求并抓取页面源代码，其中只包含20条tweet。我相信twitter一次只渲染几个tweet，但我想知道是否有一种方法，可以在不使用twitter api的情况下，获得比最初在页面上呈现的更多的tweet。我当前发出请求的代码如下所示： im

浏览 0提问于2017-06-13得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么通过漂亮汤导入的html与实际的html不同？

如何设置BeautifulSoup以避免错误结果？

Python POST请求

Beautifulsoup功能在特定场景下不能正常工作

使用Python下载URL的html* -但启用了javascript*

课堂上的BeautifulSoup查找不起作用

BeautifulSoup将单引号替换为双引号

为什么BeautifulSoup在第二次解析时工作，而不是第一次解析？

在Solr中分页是否需要排序？

如何将文本值标记更改为cdata节

(美丽的汤、硒和PhantomJS)：只刮整页的一部分

如何使用BeautifulSoup解析javascript内容

使用Python阅读网页搜索结果

相同的CSS，不同的结果在浏览器和bs4 .select()方法

对预填充solr的只读访问

从DOM解析HTML* (非静态HTML)*

如何在jrunscript或jjs中访问标准输入(在win7上)

在没有Twitter API的情况下根据Hashtag抓取历史推文

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐