在 project_name 文件夹下创建一个名为 project_name 的Scrapy项目。 语法:
scrapy startproject <project_name>
在当前项目中创建spider,可以使用提前定义好的模板来生成spider。 语法:
scrapy genspider [-t template] <name> <domain>
使用spider进行爬取。 语法:
scrapy crawl <spider>
运行contract检查。 语法:
scrapy check [-l] <spider>
列出当前项目中所有可用的spider,每行输出一个spider。 语法:
scrapy list
使用 EDITOR 中设定的编辑器编辑给定的spider。 语法:
scrapy edit <spider>
使用Scrapy下载器(downloader)下载给定的URL,并将获取到的内容送到标准输出。 语法:
scrapy fetch <url>
在浏览器中打开给定的URL,并以Scrapy spider获取到的形式展现。 语法:
scrapy view <url>
以给定的URL(如果给出)或者空(没有给出URL)启动Scrapy shell。 语法:
scrapy shell [url]
获取给定的URL并使用相应的spider分析处理。 语法:
scrapy parse <url> [options]
支持的选项:
在项目中运行时,该命令将会输出项目的设定值,否则输出Scrapy默认设定。 语法:
scrapy settings [options]
在未创建项目的情况下,运行一个编写在Python文件中的spider。 语法:
scrapy runspider <spider_file.py>
输出Scrapy版本。 语法:
scrapy version [-v]
将项目部署到Scrapyd服务。 语法:
scrapy deploy [ <target:project> | -l <target> | -L ]
运行benchmark测试。 语法:
scrapy bench