腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Scrapy
CrawlerRunner
:
缺少
输出
、
、
我一直在使用堆栈溢出(https://stackoverflow.com/a/43661172/5037146)中描述的方法,使用爬虫运行程序从脚本中运行
scrapy
,以允许重新启动进程。但是,当我通过
CrawlerRunner
运行进程时,我没有得到任何控制台日志,而当我使用CrawlerProcess时,它会
输出
状态和进度。
浏览 19
提问于2019-08-30
得票数 0
回答已采纳
1
回答
CrawlerRunner
()未通过
scrapy
的管道文件
、
、
我正在尝试从Django调用
scrapy
spider,views.py file.The spider确实被调用了,但它的
输出
显示在命令提示符中,并且没有保存在Django模型中以将其呈现到页面上。我单独检查了运行爬虫以验证
scrapy
和Django是否连接并且工作正常,但当使用
CrawlerRunner
()脚本进行自动化时,它不能正常工作。所以在Django Views.py文件的
CrawlerRunner
()实现中
缺少
一些组件。import signals from twisted
浏览 44
提问于2020-02-01
得票数 0
回答已采纳
1
回答
更改
Scrapy
CrawlerRunner
的设置
、
、
我正在尝试更改
Scrapy
的设置。我之前已经成功地为CrawlerProcess做到了这一点。但我似乎不能让它在
CrawlerRunner
上工作。日志应该被禁用,但我仍然可以看到日志的
输出
。import
scrapy
from
scrapy
.crawler import
CrawlerRunner
from
scrapy
.utils.log import configure_loggi
浏览 3
提问于2017-03-24
得票数 2
1
回答
为什么
scrapy
crawler只能在flask应用中运行一次?
、
render_template, request, redirect, url_for, session, make_responsefrom
scrapy
.spidersimport CrawlSpider, Rulefrom
scrapy
.crawler import在finish-crawl.html中,用户可以下载具有
输出
的文件(没有包含它,因为
浏览 19
提问于2020-12-31
得票数 1
回答已采纳
2
回答
CrawlerRunner
不使用钩针抓取页面
、
、
、
我正在尝试使用
CrawlerRunner
()从脚本启动一个剪贴画,以便在AWS Lambda中启动。代码如下:from
scrapy
.crawler import
CrawlerRunner
configure_logging({'L
浏览 0
提问于2019-01-29
得票数 0
5
回答
在脚本文件函数中获取
Scrapy
crawler
输出
/结果
、
、
、
、
我使用脚本文件在
scrapy
项目中运行爬行器,并且爬行器记录爬虫的
输出
/结果。但是我想在脚本文件中使用爬行器
输出
/结果,在某些函数中,.I不想将
输出
/结果保存在任何文件或DB中。下面是从获取的脚本代码from
scrapy
.crawler import
CrawlerRunner
from
scrapy
.utils.logimport configure_loggi
浏览 3
提问于2016-10-25
得票数 12
4
回答
twisted.internet.error.ReactorAlreadyInstalledError:反应堆已经安装
、
我正在使用
scrapy
2.6,这是我的代码:from football.spiders.laliga importLaligaSpider process = CrawlerProcess(settings
浏览 19
提问于2022-03-20
得票数 3
1
回答
我怎么能同时运行不同的蜘蛛,因为它们有不同的爬行器设置
默认用法是:from twisted.internet import reactorfrom
scrapy
.utils.log import configure_logging # Your fir
浏览 7
提问于2022-10-14
得票数 1
回答已采纳
1
回答
如何在django视图中运行带有参数的刮擦蜘蛛
、
、
、
books = Book.objects.filter(title__contains=key) # I want to call the
scrapy
浏览 3
提问于2016-04-27
得票数 6
1
回答
在Python中使用settings.py时未加载
CrawlerRunner
文件
、
我试着在下面的代码上调试运行,并在settings.py文件中有一个断点,它完成时没有进入这一行代码:runner =
CrawlerRunner
() 我想做的是在一次运行中运行多个蜘蛛
浏览 1
提问于2017-05-15
得票数 2
回答已采纳
1
回答
有没有办法重启抓取爬虫?
、
下面是我的代码: from
scrapy
.spiders import CrawlSpider, Rule name
浏览 16
提问于2020-12-30
得票数 2
回答已采纳
1
回答
如何将返回的
Scrapy
数据分配给变量?
、
import
scrapy
} runner2 =
CrawlerRunner
runner2 =
Crawle
浏览 2
提问于2022-09-12
得票数 0
回答已采纳
1
回答
从烧瓶webapp获取URL,并在SQLite3数据库中保存刮过的项目。不确定是否调用了process_item
、
、
、
蜘蛛代码:name = 'content'start_urls = [] app = Flask(__name__) crawl_runner =
CrawlerRunner
()
浏览 5
提问于2020-08-15
得票数 0
回答已采纳
1
回答
Scrapy
-如何在使用脚本启动蜘蛛时加载项目级别的settings.py
、
、
from
scrapy
.crawler import
CrawlerRunner
runner =
CrawlerRunner
因此,使用
CrawlerRunner
时,在执行爬行器时不会
浏览 1
提问于2018-10-31
得票数 7
1
回答
来自python脚本的爬行器
、
、
根据documentation ,我正在尝试从python脚本运行
scrapy
spider = PitchforkSpider(domain='"pitchfork.com我的版本是
Scrapy
1.1.2
浏览 5
提问于2016-09-26
得票数 0
回答已采纳
1
回答
我的
Scrapy
命令工作,但
输出
为空
、
我在
Scrapy
中测试了代码并运行良好。from
scrapy
.crawler import
CrawlerRunner
浏览 3
提问于2022-09-28
得票数 0
回答已采纳
1
回答
运行多个爬行器时,反应器无法重新启动
、
、
我试着这样做: from
scrapy
.crawler import CrawlerProcess from
scrapy
.utils.project import get_project_settings
浏览 19
提问于2019-02-28
得票数 2
回答已采纳
1
回答
如何在芹菜中运行抓取蜘蛛
、
、
、
关于如何在芹菜任务中设置
Scrapy
,避免重新启动Twister反应器以防止twisted.internet.error.ReactorNotRestartable错误,有几个帖子。我尝试过使用
CrawlerRunner
作为和,但要使其工作,必须从代码中删除以下行:reactor.run() # Script这是完整的代码: @app.task(bind=True,
浏览 5
提问于2022-02-02
得票数 1
1
回答
如果条件不满足,如何使刮痕蜘蛛再次爬行?
、
在我的close函数中,我正在检查今天刮过的文档是否存在,如果找不到这样的文档,我想告诉我的蜘蛛再刮一次。基本上,我需要一个强大的方法,让刮刀继续调用它的爬行例程,直到满足某个条件或MAX_RETRIES已经用尽。
浏览 5
提问于2022-02-11
得票数 0
回答已采纳
1
回答
如何让
Scrapy
在python项目中爬行?
、
我想在这个url上保存信息,我按照
Scrapy
教程学习了如何使用这个工具。但是,有没有一种方法可以在MyScrapClass.crawl()这样的Python项目中启动爬行,而不是使用linux命令
scrapy
crawl MyScrapProject?
浏览 1
提问于2016-03-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
快速上手——我用scrapy写爬虫(一)
Scrapy-基于python的最常见爬虫框架-初体验
码以致用02-用Scrapy 爬虫抓取简单心理咨询师资料
Python+Scrapy+妹子图
Python技术:Scrapy架构介绍
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券