如何抓取使用JavaScript呈现数据的网站_如何使用python从javascript网站抓取数据_使用Javascript抓取网站？ - 腾讯云开发者社区

、、、

我正在抓取这个网站的https://robertsspaceindustries.com/pledge/ship-upgrades?to-ship=173，我想得到‘箭头’文本的右侧的‘选择你的船’文本我尝试使用请求和BeautifulSoup来选择包含文本的标记，当我检查页面时，我可以看到文本在哪里它在标记之间我尝试使用soup.select(".name")选择它仍然是

浏览 6提问于2019-01-22得票数 1

回答已采纳

1回答

如何使用Javascript抓取呈现的网站？

、、、

我试着刮一下这个网站的$('a[href^="mailto:"]')：我是通过firebase函数来完成这个任务的，所以我认为我所能安装的东西是有

浏览 3提问于2017-11-09得票数 1

回答已采纳

1回答

数据被&nbsp；隐藏，并在使用Beautiful Soup抓取网页时重新生成类

、、

我试图从一个网站获取定价数据，但每次页面加载时，t类都会重新生成一个不同的字母序列，并且价格显示为 而不是数字。有没有什么技术可以让我以某种方式绕过它？谢谢!下面是我检查元素时显示的html行： <div class="qFwqmC hkVukg2 njGalW"> </div> 您的帮助将不胜感激

浏览 1提问于2018-04-07得票数 0

1回答

为什么scrapy在这个例子中不能工作？

、

我试图从一个网站抓取数据，如文章枚举，定价和股票，并将其导出到excel工作表。以下脚本成功登录。未登录时，仅可见articl枚举器。我测试了刮刀，它成功地抓取了文章编号。在下面的示例中，我尝试将登录和抓取数据结合起来，但它不起作用。我做错了什么？

浏览 15提问于2021-11-05得票数 0

2回答

执行从随机网站下载的javascript代码

、

我做了一个工具，从其他网站(任何类型)抓取所有的html，css，javascript和图片。然后我在我自己的域名上执行这个(当然是在修改链接之后)。javascript也会执行，因此页面呈现与抓取的网站上的页面呈现完全相同。但都在我的域名下。有没有什么方法可以保护这个javascript的执行(使用不受控制的

浏览 1提问于2013-05-24得票数 1

1回答

是否可以使用python从交互式JS图中提取数据？

、

我想知道是否可以从交互式JS图中提取出像这里这样的JS图：还只想提取四个国家显示的百分比大多数看起来只适合静态的表格，比如维基百科上的那些。BeautifulSoup、Pandas、Request和Selenium --我试着检查了这个网页，以查看它的xhr数据，并试图找出是否有一个附加的</

浏览 4提问于2021-01-26得票数 0

回答已采纳

1回答

Python使用从javascripts呈现的数据进行抓取

、、、

我想从一个用javascript呈现的网站()中抓取数据。我想得到所有的球员，和徽章，价格和价格变化的每个球员。如何在呈现后从网站获取所有数据？我正在尝试在刮擦之前呈现整个页面(包括脚本)。我不能使用BS4，因为页面源不包含主体(主体都是从javascript呈现的)。另外，我还通过网络选项卡查看了哪些应用程

浏览 3提问于2022-11-19得票数 0

回答已采纳

1回答

网站总是使用过时的浏览器来标记它

、、

我正在尝试抓取网站的，以便使用这些信息来建立一个时间表。问题是该站点总是检测到过时的浏览器(显示)。<div class=noscript>We\'re sorry but AniChart requires Javascript.72.0.3626.109'} 我知道该站点使

浏览 5提问于2019-02-18得票数 0

1回答

使用phantomjs或node从网站上抓取通过web套接字传输的数据流

、、、、

我想从一个网站上抓取数据。这些数据呈现在网站上的HTML画布上，并不断更新。据我所知，一个人不能从画布元素上抓取数据，因为它或多或少是一个图形。但事实仍然是，这些数据被流式传输到我的浏览器中，所以使用PhantomJS或NodeJS等无头JavaScript引擎，我应该能够访问从web套接字传出的原始数据。我已经使用</

浏览 1提问于2014-12-11得票数 1

1回答

如何从承载HTML之外的表数据的网站中刮表？

、、、、

我正在尝试从这个表URL：中抓取表数据在之前的测试中，我使用了以下Python包:从bs4导入BeautifulSoup导入请求导入mysql.connector作为pd从sqlalchemy导入create_engine我

浏览 3提问于2022-04-02得票数 -1

回答已采纳

1回答

为循环抓取未找到所有索引范围

、

我完成了教程部分的构建和刮除的报价，Scrapy提供。我现在正在尝试做一个真正的网站。网络刮刀器正在抓取我发送给它的信息，但它并没有像我想的那样被列在列表上。当我在列表中索引时，刮伤外壳是不稳定的。当我使用外壳并传递它时它返回实际网站上的第四项。这是我的

浏览 2提问于2020-02-05得票数 0

1回答

尝试使用Google ()导入表。但没有出现任何内容

、、、

我正在尝试将以下网站加载到Google中：有人能帮助提供一个在谷歌文档中起作用的公式来完成这个任务吗？这个网站每天都是随机更新的，所以我想使用谷歌文档来帮助跟踪。下面是我正在做的事情的两张图片。

浏览 0提问于2019-08-19得票数 1

1回答

如何使用Scrapy从网站中抓取JavaScript呈现的数据？

、、

使用Scrapy，我试图刮掉标记<script type="application/ld+json">....的数据 yield response.follow(next_page, self.parse) 但是，在编写完终端中的scrapyrunspider test_spider.py - O test1.jl之后，我

浏览 2提问于2022-01-09得票数 0

回答已采纳

1回答

使用scrapy splash对抓取速度有显著影响吗？

、、、、

到目前为止，我一直在使用scrapy和编写自定义类来处理使用ajax的网站。但是，如果我使用scrapy-splash，据我所知，它会在javascript之后抓取呈现的html，爬虫的速度会受到严重影响吗？使用scrapy抓取一个普通的html页面所需的时间与使用scrapy-splash抓取java

浏览 3提问于2018-04-18得票数 12

回答已采纳

2回答

链接到下一页的CSS选择器在Scrapy shell中返回空列表

、、、

我是新来Scrapy的。我尝试从此站点https://book24.ru/knigi-bestsellery/?section_id=1592获取到下一页的链接 html是什么样子的：enter image description here 在scrapy shell中，我写了这个命令： response.css我将非常感谢您的帮助！

浏览 46提问于2021-10-15得票数 2

回答已采纳

1回答

从xpath获取背景图像url

、、

/@style, \"background-image: url('\"), \"')\")", ),}<div style

浏览 1提问于2021-09-10得票数 0

2回答

使用码头，刮起的飞溅在赫洛库

、、、

我有一个刮擦蜘蛛，它使用splash，它运行在Docker上:8050在抓取之前呈现javascript。我试图运行在heroku，但不知道如何配置heroku启动码头运行之前，我的网站:抓取爬行abc dyno。任何导游都是非常感谢的！

浏览 3提问于2017-09-05得票数 7

2回答

用BeautifulSoup抓取下拉选项

、、

我想网络刮一个选择列表与BeautifulSoup，以获得汽车原始设备制造商的名单。因为我刚刚开始编码，我会非常感谢您的输入！谢谢！)截至目前的产出：代码：import requests URL = ('https

浏览 10提问于2022-07-29得票数 -1

1回答

有没有办法在没有库的情况下抓取动态网站？

、、、、

我正在使用'axios‘从网站抓取数据()重点是，我想在没有任何与爬行相关的库的情况下做到这一点。找到了解决它的

浏览 10提问于2021-05-29得票数 0

回答已采纳

1回答

试着擦伤一段距离

、、、

我一直在尝试使用Python中的漂亮汤从网站上抓取两个值，这给我带来了麻烦。以下是我正在抓取的页面的网址：我试过：当我尝试使用：gold_spot_shell = soup.find('div

浏览 3提问于2020-09-04得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云