Scrapy shell无法抓取网页

、、

我正在尝试使用Scrapy shell来尝试找出zone-h.org的选择器。我运行scrapy shell 'webpage'之后，我试图查看内容，以确保它是下载的。

浏览 23提问于2018-12-31得票数 1

回答已采纳

1回答

找不到命令'scrapy‘

、、、、

我正在尝试安装，这样我就可以写一个python程序来抓取网页，但我甚至还不能这样做，因为我需要抓取设置，所以我一直试图在我的shell中输入以下命令："scrapy startproject scrapy_javascript“，但得到以下错误："command ' scrapy‘not found”…我不知道哪里出了问题。我也在我下载的scrapy文件夹中。 📷

浏览 23提问于2019-05-09得票数 1

回答已采纳

1回答

如何使用Scrapy自动获取请求头？

、

然后可以将这些标头添加到Scrapy请求中。但是，有没有一种方法可以使用Scrapy请求自动获取这些请求头，而不是手动获取？

浏览 50提问于2021-05-21得票数 0

回答已采纳

3回答

scrapy shell无法打开长链接

、

我要抓取的网址是：>>> response.css("title")现在有趣的是，有时它会正确地加载相同的命令集

浏览 0提问于2016-09-27得票数 0

1回答

对于一些具有刮伤外壳的元素，XPath不返回结果。

、、

我使用刮除外壳来提取以下网页的数据： fetch('https://www.apo-in.de/product/acc-akut-600-brausetabletten.24170.html') >>> response.xpath"accordionContent5e95408f73b10"]/di

浏览 4提问于2020-04-14得票数 0

回答已采纳

1回答

关于XPath选择器的问题(用于Scrapy)

、、、

目的:从div类list_area daily_all中抓取文本数据。使用scrapy shell，我首先“抓取”了我想要抓取数据的网站：https://comic.naver.com/webtoon/weekday.nhn 使用'scrapy shell‘脚本：scrapyshell 'https://comic.naver.com/webto

浏览 18提问于2019-06-10得票数 2

1回答

抓取器正在获取相关链接。

、

我已经创建了一个使用scrapy.The爬虫爬虫的网站和抓取链接。**所使用的技术：**Python，Scrapy Error抓取相对urls，因为刮刀器无法抓取网页。我要爬虫只取无源网址。import scrapyclass MySpider(scrapy.Spider): # this is

浏览 2提问于2021-06-29得票数 1

2回答

遇到问题的脚本(选择链接)

、、、

我正在使用Scrapy，在使用脚本时遇到了问题。它可以很好地与shell配合使用：<a data-urltype="/view" data-mce-href="http:/&#

浏览 10提问于2019-10-23得票数 0

回答已采纳

2回答

菜鸟:如何克服Javascript "onclick“按钮来抓取网页？

、、

这是我想要抓取的链接：有一个按钮，我必须按下才能阅读网页上的基金信息。如果不是，视图就会被阻塞，使用scrapy shell总是会导致空[]。none";ShowDropDown(); 如何克服这个onclick="AgreeClick()“

浏览 0提问于2013-05-07得票数 9

回答已采纳

1回答

Scrapy screenshot网页从png到webp，不保存渲染的图像

、

抓取Scrapy屏幕截图网页，并在飞行中转换image.png到image.webp。图像占用大量内存，scrapy返回.png文件。我抓取了很多网页，所以我需要将其转换为image.webp，以减少磁盘消耗。

浏览 28提问于2021-03-03得票数 0

1回答

动态内容抓取

、、

我们可以使用Scrapy从由Javascript加载的网页中获取内容吗？我正在尝试从页面中抓取使用示例，但是由于它们是使用Javascript作为JSON对象加载的，所以我无法使用Scrapy获取它们。你能提出什么是处理这些问题的最佳方法吗？

浏览 5提问于2016-11-22得票数 0

回答已采纳

1回答

我正在尝试从网站上嵌入的JS下拉列表中抓取市场列表：https://e27.co/startups 使用scrapy shell，我试图从“markets”下拉菜单中抓取市场列表，但无法这样做。在运行了scrapy shell 'https://e27.co/startups'之后，我尝试了同时使用response.css()和response.xpath()。我可以知道如何从下拉列表中<e

浏览 9提问于2019-06-13得票数 0

回答已采纳

2回答

Xpath选择器在Scrapy中不起作用

、

., "Full Name")]/span/text()我已经在Google Chrome的控制台上对它进行了测试(可以工作)，就像Xpath的许多其他变体一样，但我无法让它与Scrapy编辑:为了更清楚起见，下面是代码的其余部分：from votesmart.items import LegislatorsItems

浏览 0提问于2016-09-12得票数 2

1回答

使用scrapy splash对抓取速度有显著影响吗？

、、、、

到目前为止，我一直在使用scrapy和编写自定义类来处理使用ajax的网站。但是，如果我使用scrapy-splash，据我所知，它会在javascript之后抓取呈现的html，爬虫的速度会受到严重影响吗？使用scrapy抓取一个普通的html页面所需的时间与使用scrapy-splash抓取javascript渲染的html所需的时间进行了怎样的比较？最后，scrapy splash和Selenium的比较如何？

浏览 3提问于2018-04-18得票数 12

回答已采纳

1回答

在ubuntu精确服务器重新启动后无法连接mongodb

、、、

我正在Ubuntu服务器上开发一个25 am硬盘空间的web抓取项目。我正在使用python scrapy和mongodb。因此，我删除了存储在/var/lib/mongodb中的所有数据，并从shell运行"

浏览 1提问于2013-07-25得票数 1

1回答

尝试使用Python的Scrapy包，但它总是在不应该返回的地方返回空值

、、、、

--------------------------------------------------------------------- import os pg_num = pg_num.xpath("normalize-space(//div[@class='showing'pg = scrapy.Selector(text = html) pg

浏览 17提问于2020-03-27得票数 0

9回答

BeautifulSoup和Scrapy crawler有什么区别？

、、、

我对BeautifulSoup比较熟悉，但对Scrapy crawler不太熟悉。

浏览 323提问于2013-10-30得票数 146

回答已采纳

1回答

scrapy shell在添加第二个爬行器时不显示>>>

、

我使用以下命令创建了一个新的scrapy项目：在爬虫文件夹中，我正在创建我的scrapy类，它包含了抓取数据的所有逻辑。我正在使用Scrapy Shell进行测试。当我创建第一个爬虫时，scrapy shell运行得很好。但在创建第二个爬虫时，scrapy shell不起作用。使用以下命令调用scrapy s

浏览 2提问于2020-04-08得票数 1

1回答

使用spalsh的scrapy* javascript不会呈现页面*

、、、

我想爬行，我跟随爬行，但是它没有呈现网页。我用这个：诚挚的问候

浏览 0提问于2020-12-12得票数 0

回答已采纳

1回答

在刮刮中处理XMLHttpRequest

、、

我在抓取这类网页的表格：当我尝试： scrapy shell http://www.trulia.com/q_schools_in_district.php?

浏览 1提问于2016-01-05得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

找不到命令'scrapy‘

如何使用Scrapy自动获取请求头？

scrapy shell无法打开长链接

对于一些具有刮伤外壳的元素，XPath不返回结果。

关于XPath选择器的问题(用于Scrapy)

抓取器正在获取相关链接。

遇到问题的脚本(选择链接)

菜鸟:如何克服Javascript "onclick“按钮来抓取网页？

Scrapy screenshot网页从png到webp，不保存渲染的图像

动态内容抓取

无法使用Scrapy从下拉列表中进行抓取

Xpath选择器在Scrapy中不起作用

使用scrapy splash对抓取速度有显著影响吗？

在ubuntu精确服务器重新启动后无法连接mongodb

尝试使用Python的Scrapy包，但它总是在不应该返回的地方返回空值

BeautifulSoup和Scrapy crawler有什么区别？

scrapy shell在添加第二个爬行器时不显示>>>

使用spalsh的scrapy* javascript不会呈现页面*

在刮刮中处理XMLHttpRequest

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐