腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
3
回答
未知命令:爬网错误
python
、
scrapy
、
web-crawler
我是python
的
新手。我在64位操作系统上运行python 2.7.3版本32位。(我尝试了64位,但不起作用)。C:\Python27\Scripts>
scrapy
Scrapy</e
浏览 3
提问于2012-04-12
得票数 33
2
回答
如何在启动刮伤外壳时禁用robots.txt?
python
、
scrapy
、
web-crawler
、
robots.txt
、
scrapy-shell
我
使用
Scrapy
时,几个网站都没有问题,但是当机器人(robots.txt)不允许访问一个站点时,我会发现问题。如何通过
Scrapy
(忽略存在)禁用机器人检测?提前谢谢你。我说
的
不是
Scrapy
创建
的
项目
,而是
Scrapy
命令:
scrapy
shell 'www.example.com'
浏览 2
提问于2016-11-26
得票数 11
回答已采纳
1
回答
在一个进程
中
运行多个爬行器--没有保存输出数据
python
、
mysql
、
scrapy
、
scrapy-pipeline
尝试
使用
Scrapy
创建货币解析器。创建了两个蜘蛛,如果它们单独运行,它们可以正常工作。尝试为每个进程运行两个爬行器-在输出
中
不提供任何数据。无论是否尝试将其保存到txt、json或数据库。
使用
MySQL数据库。 但是在每个进程
中
运行一个爬虫--成功地保存了数据。将数据保存到数据库或其他任何位置
的
唯一方法是运行
scrapy
crawl Liga &&
scrapy
crawl IFinance。主要
的
爬虫代码: fro
浏览 12
提问于2019-04-25
得票数 0
回答已采纳
1
回答
用Anaconda运行抓取蜘蛛
python-2.7
、
scrapy
、
anaconda
、
scrapy-spider
你好,我正在努力完成在以下网站上找到
的
教程: 文件"//anaconda/lib/python2.7/site-packages/
scrapy
/spiderloader.py",第43行,在load KeyError(“蜘蛛未找到:{}".format(spider_name但是,当我直接导
浏览 5
提问于2016-10-06
得票数 2
回答已采纳
1
回答
刮刮:如何针对不同
的
项目
使用
不同
的
settings.py
python
、
scrapy
我希望在
scrapy
中
使用
不同
的
项目
设置,我
的
目录结构是: -project1 -settings.py -settings.py我
的
scrapy
.cfg是:default = project1.settings[deploy] project = proje
浏览 1
提问于2018-07-26
得票数 1
2
回答
指示
Scrapy
忽略站点
的
内容长度
python
、
http
、
curl
、
scrapy
问题curl --ignore-content-length -u <user:pass> http://data.icecat.biz但是,我不知道如何在
中
做到这一点。谷歌和文档对我没有任何启示。 在我深入研究
Scrapy
代码来解决这个问题之前,也许已经有人这样做了。
浏览 0
提问于2016-04-09
得票数 3
回答已采纳
1
回答
Python抓取如何查找更多命令
python
、
scrapy
我试图
使用
scrapy
访问“爬行”命令,但它会引发“未知命令:爬行”错误。所以我想我必须去刮刮
的
地方然后从那里跑。不过,当我试着做这个
的
时候:
Scrapy
1.4.0 - no active project谢谢你
的
帮助<3当我运行我
的
项目
文件,也就是我在D dir上创建自己时
浏览 1
提问于2017-09-08
得票数 1
回答已采纳
1
回答
Python
Scrapy
tutorial KeyError:‘找不到爬虫:
python
、
scrapy
我正在尝试编写我
的
第一个抓取蜘蛛,我一直在上
的
教程,但我得到一个错误"KeyError:‘蜘蛛找不到:“
scrapy
scrapy
.cfg(proscraper)#( 10/14/14@ 2:13pm )( tim@localhost ):~/Workspace/Developm
浏览 2
提问于2014-10-14
得票数 6
回答已采纳
4
回答
没有模块名为
scrapy
时,打开擦伤
项目
中
的
py魅力。
python
、
scrapy
、
pycharm
我已经生成了
Scrapy
项目
,但是当我在PyCharm
中
打开这个
项目
时 import
scrapy
name = "quotes" urls = [ 'http:
浏览 6
提问于2018-01-14
得票数 1
1
回答
我是否可以在另一个
项目
中引用
Scrapy
项目
,就像c#
中
的
多个
项目
引用一样?
c#
、
python
、
scrapy
、
pycharm
1.创建一个新
的
python
项目
,创建一个新
的
.py文件;2.reference
项目
(甚至我也不知道怎么做);3.在新
的
python文件
中
编写导入:从
scrapy
.selector导入选择器从
scrapy
.http导入HtmlResponse 4.IDE报告未解决
的
引用错误(出于原因):我不知道如何修复它。 我做得对吗?它起作用了吗?
浏览 4
提问于2017-10-13
得票数 0
回答已采纳
3
回答
如何重新启动venv
项目
python
、
python-3.x
、
scrapy
我是新来
的
Scrapy
,我昨晚刚做完一个
项目
,我怎么能重新开始
使用
这个
项目
呢?我确实运行了source venv/scripts/activate,然后while启动了,但是当我运行
scrapy
crawl时,我得到了一个错误 Use "
scrapy
" to see available commands
浏览 11
提问于2022-04-01
得票数 0
回答已采纳
3
回答
在
使用
Scrapy
进行抓取之前,检查URL是否在文件
中
python
、
scrapy
、
file-read
我正在抓取一个包含URL列表
的
大文件。显然,我不能连续地抓取所有的URL。我当前
的
解决方案从文件
中
读取URL。,当我停止爬行器并尝试从我离开
的
地方继续时,程序从URL
的
原始文本文件开始,并开始重新搜索并
使用
相同
的
内容覆盖以前
的
下载。我尝试将代码放入爬行器
中
,以检查传递给解析函数
的
URL是否在"completed_urls.txt“文件
中
……但显然,随着完成
的
URL数量<e
浏览 6
提问于2019-10-11
得票数 0
1
回答
从
项目
目录外部运行
的
scrapy
引发异常
python
、
scrapy
我在下面的目录中有一个刮擦
的
项目
“教程”
项目
目录结构如下所示。我想通过我
的
自定义python脚本runspiders.py运行这个蜘蛛。from __future__ import print_function from
scrapy
.crawler import CrawlerProcess from
项目
文件夹内运行时,蜘蛛将正确运行。C:\wamp64\www
浏览 9
提问于2016-12-14
得票数 2
2
回答
ModuleNotFoundError:我
的
项目
中文件夹结构问题?
python
、
scrapy
我刚开始
使用
scrapy
和vscode,我
的
项目
非常好,直到我决定在上传github之前整理文件夹。在那之后,整个
项目
就不再有效了。我很确定我搞砸了文件夹结构: ├── project1/ │ │ ├── spiders│ │ ├── middlewares.py │
浏览 5
提问于2022-05-14
得票数 -1
3
回答
python
scrapy
不能工作-- "ImportError: No module named settings“
python
、
scrapy
/usr/lib/python2.7/site-packages/
scrapy
中
杂乱无章
的
库.../projects/
scrapy
在目录.../projects/parser_mo
浏览 4
提问于2014-07-04
得票数 5
2
回答
从Python脚本
中
运行
scrapy
- CSV导出程序不起作用
python
、
python-2.7
、
export
、
twisted
、
scrapy
当我从命令行运行它时,我
的
刮取器工作得很好,但是当我试图在python脚本
中
运行它(
使用
使用
Twisted
的
方法概述 )时,它不会输出它通常所做
的
两个CSV文件。我有一个创建和填充这些文件
的
管道,其中一个
使用
CsvItemExporter(),另一个
使用
writeCsvFile()。命令行末尾
的
输出表明,预期
的
页面数已被爬行,并且爬行器似乎已经正常完成。我没有收到任何错误信息。将打印语
浏览 3
提问于2013-07-20
得票数 6
回答已采纳
2
回答
Scrapy
1.1.0 -无活动
项目
python
、
python-2.7
、
pydev
我是Python
的
新手,在eclipse中
使用
PyDev成功安装了
Scrapy
。当我运行该程序时,它显示如下所示(如图所示)我正在运行这段代码: name = "dmoz
浏览 1
提问于2016-06-27
得票数 7
1
回答
使用
Scrapy
中
的
项目
python
、
scrapy
我
使用
Scrapy
并尝试输出一个json文件。当我不
使用
item,但我想
使用
它们时,它工作得很好。所以我
的
爬虫代码是: import jsonfrom
scrapy
.loader import ItemLoader }) yield loader.load_ite
浏览 20
提问于2019-03-18
得票数 1
回答已采纳
1
回答
运行蜘蛛:错误:找不到文件:-刮伤
python
、
scrapy
start_urls = [] 2016-05-25 20:26:42 [
scrapy
] INFO:
Scrapy
1.1.0 started (bot: tutorial) 2016-05-2520:26:42
浏览 4
提问于2016-05-26
得票数 5
回答已采纳
1
回答
抓取:如何
使用
爬行器
中
的
项目
,以及如何将
项目
发送到管道?
python
、
scrapy
、
scrapy-spider
、
scrapy-pipeline
我是
scrapy
新手,我
的
任务很简单: 我
的
问题是关于
项目
结构:如何在蜘蛛中
使用
项目
以及如何将
项目
发送到管道? 我找不到一个
使用
项目
和管道
浏览 4
提问于2017-05-11
得票数 18
回答已采纳
点击加载更多
相关
资讯
Scrapy框架的使用之Scrapy入门
Scrapy框架的使用之Scrapy通用爬虫
Scrapy框架的使用之Scrapy爬取新浪微博
pycharm创建scrapy项目
scrapy实践之item pipeline的使用
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券