腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
EventualResult
中
使用
烧瓶
运行
Scrapy
-
未处理
的
错误
、
、
、
、
我有一个
scrapy
项目,工作良好,并返回我想要
的
结果。爬虫代码是: class ExampleSpider(
scrapy
.Spider): myBaseUrl = '' yield MyItem(name=name, date=date) pass 下面是我用来
运行</e
浏览 34
提问于2021-10-11
得票数 0
2
回答
鸡皮芹菜`update_state`
、
、
、
我有以下设置(Docker): 顺便说一句:我是不是遗漏了一些关于刮伤结构
浏览 2
提问于2017-06-12
得票数 0
回答已采纳
1
回答
使用
相同
的
venv
在
py文件
中
运行
scrapy
命令
、
、
、
我想在
烧瓶
webservice (部署模式)
中
运行
scrapy
,但是当
使用
os.system时,它不会在与我
运行
webservice相同
的
虚拟环境
中
运行
scrapy
。当我
在
本地主机上
运行
它时,我没有同样
的
问题。有什么办法吗?os.chdir(SCRAPYFILE_PATH) os.system(
浏览 10
提问于2022-05-15
得票数 0
回答已采纳
2
回答
为
Scrapy
构建一个RESTful瓶API
、
、
、
、
API应该允许包含用户希望刮取
的
URL
的
任意HTTP请求,然后Flask应该返回刮取
的
结果。有更好
的
方法来架构这个解决方案吗?或者我如何允许scrape_it
在
不停止扭曲
的
反应堆(不能再次启动)
的
情况下返回?api from t
浏览 9
提问于2015-09-22
得票数 10
回答已采纳
1
回答
如何通过python激活别名?
、
、
、
我
在
redhat服务器上安装了python2(作为默认环境)和python3,并为它们设置了不同
的
别名。我如何
使用
python脚本激活它,因为我需要在
scrapy
上
运行
python3蜘蛛? 更新:,我想把抓取蜘蛛和
烧瓶
作为API进行集成。当POST方法到达端点url时,我想
运行
刮伤蜘蛛。目前蜘蛛各自
运行
良好。myconda标识为别名,而是
使用
默认
的
python2环境而不是python3启动蜘蛛,并给出python2语
浏览 1
提问于2018-03-10
得票数 1
1
回答
刮伤教程扭曲
错误
、
我对
Scrapy
很陌生,对python只有一个基本
的
理解。(刮刮) F:\My Projects\
scrapy
\Scripts\tutorial>
scrapy
爬行引用\site-packages\twisted\internet\defer.py&q
浏览 0
提问于2016-11-05
得票数 0
回答已采纳
1
回答
颤振
未处理
异常: SocketException: OS
错误
:管道破裂,errno = 32,地址= 10.0.2.2,端口= 51420
、
我是
使用
颤振与瓶在后端。我想发送一个图像从颤振到
烧瓶
进行处理。但是我
在
Android
中
得到了这个
错误
: Error: flutter/lib/ui/ui_dart_state.cc(186个)
未处理
的
异常: SocketException: OS
错误
:坏管道,errno= 32,地址= 10.0.2.2,端口= 51420 我
的
烧瓶
终端写着: 127.0.0.1 --2021年5月11日
浏览 3
提问于2021-05-11
得票数 2
1
回答
如何将数据从一个
烧瓶
API传递到一个网络刮刀?
、
我正在做一个应用程序项目,允许用户
在
输入一组关键字后获得网页搜索结果,这些关键字将被发送给询问者。为此,我
在
的
下面这篇文章
的
启发下,用
烧瓶
创建了一个api。下面是我
的
烧瓶
api文件:crochet.setup() yield response.follow(
浏览 7
提问于2022-06-16
得票数 0
1
回答
从
烧瓶
应用程序
中
运行
刮擦
、
、
、
、
我有一个爬虫,我想
运行
每次一个人去链接。因为所有其他模块都在水瓶
中
,所以我也被告知要在
烧瓶
中
构建这个模块。我已经
在
虚拟环境
中
安装了
scrapy
和selenium,并在带有root
的
机器上安装了全局。当我
在
终点站
运行
爬行器时,一切正常。当我启动Flask应用程序并在浏览器
中
访问xx.xx.xx.xx:8080/whats时,它也可以正常工作,
运行
我
的
爬虫并
浏览 4
提问于2015-08-17
得票数 3
回答已采纳
3
回答
Python命令行细分(用于"
scrapy
")
、
、
我正在尝试安装
SCRAPY
并
使用
它。
scrapy
startproject tutorial 你能不能分解一下,帮我理解一下。我
在
我
的
Windows7机器上有各种版本
的
Python,用于各种冲突
的
项目,所以当我用他们
的
.exe安装
Scrapy
时,它会将其安装在c:\Python26_32bit目录下,这是可以
的
。但是
在
我
的
路径<e
浏览 0
提问于2011-05-26
得票数 3
回答已采纳
1
回答
刮掉
的
SgmlLinkExtractor忽略了允许
的
链接
、
、
请查看
Scrapy
文档
中
的
。其解释是: from
scrapy
浏览 2
提问于2009-11-28
得票数 10
回答已采纳
2
回答
烧瓶
:异常后停止服务器
、
当出现
未处理
的
异常时,我希望立即停止我
的
烧瓶
服务器。if __name__ == '__main__':如果您
运行
此命令并转到localhost:12345,您
的
浏览器会告诉您“内部服务器
错误
”,并且python
烧瓶
将您
的
路由包装到自己
的
错误
处理
中
,并且它只打印异常。 我想让服务器停止一条路由产生异常。但我<em
浏览 0
提问于2018-11-15
得票数 3
回答已采纳
1
回答
抓取Justdial
、
我想从Justdial
中
抓取学校名称、地址和电话号码
的
数据。我已经准备好脚本了。我
使用
Scrappy和selenium。,并在具有不同网络
的
不同机器上尝试了它,
使用
VPN、代理来
运行
这个程序。即使我试图从Justdial中提取甚至是一行简单
的
文本,我也会得到相同
的
错误
。首先我得到了403
错误
,然后
在
一些尝试之后,我得到了504
错误
,如下所示: 忽略响应<504 https:&
浏览 17
提问于2021-10-07
得票数 0
3
回答
未知命令:爬网
错误
、
、
我是python
的
新手。我
在
64位操作系统上
运行
python 2.7.3版本32位。(我尝试了64位,但不起作用)。C:\Python27\Scri
浏览 3
提问于2012-04-12
得票数 33
1
回答
刮擦合同-递延中
未处理
的
错误
、
、
、
我正在
使用
Scrapy
编写一个蜘蛛,并且我目前正在为这个蜘蛛添加契约。爬行器仍然
运行
良好,但是
在
合同
中
添加了@ results之后,在
运行
检查时得到了奇怪
的
结果。@returns response 1 当
运行
刮伤检查时,我突然得到“
未处理
的
错误
被推迟”。首先,
scrapy
的
反馈是0合同,尽管有3份合同(事实上,合同似乎只有
在
失败时才算在内)。第二
浏览 1
提问于2018-10-01
得票数 1
回答已采纳
1
回答
ModuleNotFoundError:没有名为“
scrapy
_user_agents”
的
模块
、
、
': None, } 我删除了中间件
中
的
代理行,但是我得到了相同
的
问题,相同
的
错误</e
浏览 0
提问于2019-08-13
得票数 1
回答已采纳
1
回答
Scrapy
总是从命令提示符
运行
相同
的
命令
、
我试图
在
Windows10上学习BashOnUbunty上
的
Scrapy
,我
使用
gen蜘蛛命令创建了一个蜘蛛(yelprest),然后通过创建蜘蛛文件(遵循官方教程)直接创建了另一个蜘蛛(quotes_spider第一个蜘蛛还没有测试,但是我试着用第二个蜘蛛来完成教程,当我尝试
运行
时,我得到了一个指向第一个蜘蛛
的
错误
。此外,当我尝试
运行
任何其他刮取命令(如version )时,我会得到与上面相同
的
错误
。以下是
浏览 2
提问于2017-10-30
得票数 0
回答已采纳
4
回答
scrapy
日志处理程序
、
、
我
在
以下两个问题上寻求您
的
帮助-如何像在python
中
那样为不同
的
日志级别设置处理程序。目前,我有STATS_DUMP = True 但是
Scrapy
生成
的
调试消息也会添加到日志文件
中
。这些都是非常长
的
和理想
的
,我希望调试级别的消息留下
的
标准
错误
和信息消息被转储到我
的
L
浏览 2
提问于2011-11-30
得票数 4
回答已采纳
7
回答
Cron作业
中
的
Scrapy
crawler
、
、
、
、
我想从cron作业
中
执行我
的
抓取程序。#!/bin/bash
scrapy
crawl my_spider_name */5 * * * *sh /myfolder/crawlers/getdata.sh 但是它不工作,哪里错了,我<
浏览 2
提问于2013-06-21
得票数 24
回答已采纳
1
回答
烧瓶
:用重新加载程序重新启动找不到文件
、
、
我
在
努力学习
烧瓶
。我
在
我
的
项目目录(C:\user\ian\git\flask教程)
中
创建了一个虚拟环境(venv)。FLASK_APP设置为flask教程,FLASK_DEBUG=1,我
在
目录中有一个flasktutorial.py。当我输入“
烧瓶
运行
”时,我得到以下信息:* Forcing debug mode on * Running on http:&
浏览 5
提问于2016-06-30
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在 Kubernetess 中使用 DNS和Headless Service 发现运行中的 Pod
Python分布式爬虫详解(一)
智能酒精度蒸馏仪使用方法
python爬虫系列开发(二)scrapy安装指南
Python之Scrapy 爬虫框架视频详解
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券