localhost上的Scrapy splash连接被拒绝:8050

文章/答案/技术大牛

发布

1回答

、、、

我已经按照Windows8.1的官方文档安装了scrapy-splash，但是当我访问时，我得到了连接被拒绝的错误以下是docker cmd日志：2019-08-14 02:09:1

浏览 21提问于2019-08-14得票数 1

2回答

刮溅活动内容选择器在shell中工作，但不与蜘蛛一起工作。

、、、、

我刚刚开始使用scrapy从opentable.com检索预订的数量。以下内容在shell中工作得很好： 'Booked 17 times today', 'Booked 29 times today',] 然而

浏览 0提问于2018-06-16得票数 2

回答已采纳

2回答

刮擦+飞溅=连接被拒绝

、、、

' 'scrapy_splash.SplashCookiesMiddleware': 723,'scrapy_splash.SplashDeduplicateArgsMiddleware': 100,SPLASH_URL = 'http:/&

浏览 1提问于2017-06-29得票数 2

2回答

连接到Kubernetes，GKE上的Splash服务

、、、

我有一个Python控制器，它使用scrapy-splash库将SplashRequest发送到service。 Kubernetes版本1.7 (也在1.9上试

浏览 0提问于2018-03-08得票数 2

回答已采纳

1回答

ScrapyJs (scrapy + splash)无法加载脚本，但splash服务器运行良好

、、、、

我正在尝试应用Scrapy (scrapyjs)来抓取带有脚本的页面，以便获得完整的加载页面。我应用splash + scrapy用下面的代码来渲染它。这与直接使用localhost:8050服务器的参数完全相同。)

浏览 1提问于2017-05-11得票数 1

1回答

我在使用Scrapy-Splash和HTTP proxy (参见)时遇到了一些问题，即使我试图在之后设置一个代理配置文件。为了更好地理解发生了什么，我正在寻找Scrapy-Splash源代码的一部分，，它解析/etc/splash/proxy-profiles中的.ini文件中指定的代理host和port。有人能给我解释一下代理分析是如何在Scrapy-Splash中实现的</e

浏览 5提问于2017-07-13得票数 3

1回答

如何在google的网络商店搜索结果上抓取动态生成的数据

、、、、

我尝试使用Scrapy和Scrapy-Splash呈现所需的页面，但仍然得到相同的响应。我使用Docker在端口8050上运行scrapinghub/splash容器的一个实例。我甚至访问了网页http://localhost:8050并手动输入了我的网址，但它无法呈现数据，尽管消息显示成功。这是我为爬虫写的代码。它实际上<

浏览 12提问于2019-07-07得票数 0

1回答

擦伤飞溅错误:放弃重试504网关超时

、、、、

我正在接收这个504网关错误，当我在尝试爬行这个的时候使用splash和scrapy一起学习splash。Splash正在8050港口的一个码头集装箱上运行。蜘蛛文件from scrapy_splash import SplashRequest name=

浏览 5提问于2022-02-16得票数 0

回答已采纳

1回答

绕过start_urls

、、

在运行这个蜘蛛时，scrapy告诉我，正在刮的页面是'http://192.168.59.103:8050/render.html' (在start_requests "meta“参数中定义的启动呈现端点当然，这是我想传递给start_urls的url，而不是我想刮的那个。我猜想问题在于我如何将urls从start_urls传递到start_requests以进行解析，但我无法准确地找到问题所在。这也是我的提

浏览 0提问于2016-05-08得票数 0

回答已采纳

1回答

来自守护进程- scrapinghub/splash的错误响应

、、、、

我已经为windows7安装了scrapy和docker工具箱，以便能够使用javascript从网站中抓取数据。安装似乎是好的，因为所有的检查都是预期的结果。Docker已经成功地提取了scrapinghub/splash，但是当我使用docker run -p 8050:8050 scrapinghub/splash运行它时，我得到了以下错误： docker:来自守护进程的错误响应:驱动程序在端点zen_elion上<

浏览 3提问于2020-01-23得票数 0

回答已采纳

1回答

ScrapySlash“掩码”404

、

我有一些问题，试图管理404响应与我的蜘蛛。ScrapySlash似乎用200掩盖了404的响应。这是我的密码 request = Request(url, self.parse, meta={'splash': { 'html': 1,: dbid

浏览 2提问于2017-01-11得票数 1

回答已采纳

1回答

刮擦-Splash不呈现此页面

、、、、

中拥有的与Splash相关的设置： 'scrapy_splash.SplashCookiesMiddleware= 'scrapy_splash.SplashAwareDupeFilter' HTTPCACHE_STO

浏览 0提问于2018-07-20得票数 1

1回答

Scrapy总是返回同一页

、、、、

对于几个Disqus用户中的每一个，他们的个人资料urls都是预先知道的，我想要抓取他们的姓名和追随者的用户名。我正在使用scrapy和splash do来实现此目的。08-07 23:09:12 [scrapy.core.engine] DEBUG: Crawled (200) <POST http://localhost:8050/render.html> (refere

浏览 12提问于2017-08-08得票数 4

回答已采纳

3回答

如何到达一个非常深嵌套的A HREF为我的蜘蛛找到下一个按钮？

、、、、

我正在做我的第二只蜘蛛，我发现这个特殊的结构对我来说非常复杂，我希望你能帮我。我有这个html页面(请注意，所有不必要的数据都被删除了，我只留下了我感兴趣的链接： <head>现在，具体来说，我需要我的蜘蛛遵循这个链接(在表中，在3跨下，在9A标记之后)。提取逻辑的其余部分都完成了。具有讽刺意味的是，除了表和I感兴趣的表之外，所有标签都没有任何类或id。但是

浏览 1提问于2018-04-05得票数 1

回答已采纳

1回答

刮擦-等待页面加载的飞溅

、、、

基本上，SplashRequest和scrapy.Request似乎都会运行并产生结果。然后，我了解了LUA脚本作为这些请求的参数，并尝试了使用不同形式的wait()形式的LUA脚本，但看起来这些请求实际上从未运行过LUA脚本。它马上就完成了，我的HTMl选择器找不到我要找的东西。我在这里遵循的指导，并让它们的docker实例在localhost上运行:8050并

浏览 0提问于2019-08-30得票数 0

回答已采纳

1回答

用旋转的代理程序运行刮擦飞溅

、、、

': 723, 'scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware': 810,} # Splash se

浏览 1提问于2018-01-22得票数 3

1回答

抓取开机画面设置："SPLASH_URL“

、、

我的电脑上有一个scrapy spider的工作实例。然后，我将其迁移到我的linux服务器上。爬行器工作得很好，检索结果时不会飞溅。然而，对于相同的网站，当我使用splash ()时，我的爬行器不会检索任何东西，并返回404错误。我在我的服务器上设置了nginx和django，我想知道这是否与splash的"SPLASH_URL“设置冲突。1)我已经尝

浏览 1提问于2017-06-17得票数 1

1回答

拒绝访问:您没有在此服务器上访问"http://www.airbnb.ca/rooms/48058366/“”的权限

、、、

我正在使用splash获取HTML，但是返回的response.body给了我一个拒绝访问的机会。我可以在工具中查看数据，但是由于这个错误，HTML无法提取。另外，当我只使用splash时，我会看到完整的HTML！我为任何人放置了我的github链接：访问被拒绝‘

浏览 7提问于2022-01-31得票数 0

回答已采纳

1回答

为什么刮痕不发送正确的url？

、、、、

我正在使用Splash来呈现javascript。但是它发送的URL不正确。准确地说，它发送前面的url。看看这段代码。, 'splash_url': 'http:

浏览 4提问于2020-08-02得票数 0

回答已采纳

1回答

尝试抓取网站时出现连接被拒绝错误

、、、、

我认为这可能与我的Splash_url有关，即使我验证了localhost8050已经启动并运行。因为如果不是这样，我就不知道问题是什么了。': 810,SPLASH_URL = 'http://localhost:8050'HTTPCACHE_

浏览 67提问于2019-05-29得票数 0

回答已采纳

点击加载更多