Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯云主机Python3环境安装Scrapy爬虫框架过程及常见错误

腾讯云主机Python3环境安装Scrapy爬虫框架过程及常见错误

原创
作者头像
崔庆才
修改于 2017-06-19 11:10:51
修改于 2017-06-19 11:10:51
4.4K00
代码可运行
举报
文章被收录于专栏:进击的Coder进击的Coder
运行总次数:0
代码可运行

Scrapy安装介绍

Scrapy的安装有多种方式,它支持Python2.7版本及以上或Python3.3版本及以上。下面说明Python3环境下的安装过程。

Scrapy依赖的库比较多,至少需要依赖库有Twisted 14.0,lxml 3.4,pyOpenSSL 0.14。而在不同平台环境又各不相同,所以在安装之前最好确保把一些基本库安装好,尤其是Windows

腾讯云有Windows、Linux多个版本系统,在这里分别介绍。

各平台安装简介

Anaconda

这种方法是一种比较简单的安装Scrapy的方法(尤其是对Windows来说),你可以使用该方法安装,也可以选用下文中专用平台的安装方法。

Anaconda是包含了常用的数据科学库的Python发行版本,如果没有安装,可以到https://www.continuum.io/downloads下载对应平台的包安装。

如果已经安装,那么可以轻松地通过conda命令安装Scrapy。

安装命令如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
conda install Scrapy

Windows

  • 安装lxml

最好的安装方式是通过wheel文件来安装,http://www.lfd.uci.edu/~gohlke/pythonlibs/,从该网站找到lxml的相关文件。假如是Python3.5版本,WIndows 64位系统,那就找到lxml‑3.7.2‑cp35‑cp35m‑win_amd64.whl 这个文件并下载,然后通过pip安装。

下载之后,运行如下命令安装:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install wheel
pip3 install lxml‑3.7.2‑cp35‑cp35m‑win_amd64.whl

即可完成lxml的安装,其他文件替换文件名即可。

  • 安装zope.interface

到官方网站https://pypi.python.org/pypi/zope.interface#downloads下载对应版本的wheel文件,然后pip安装。比如Python 3.5版本,Windows 64位系统,就下载zope.interface-4.3.3-cp35-cp35m-win_amd64.whl。

然后安装wheel文件即可,命令如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install zope.interface-4.3.3-cp35-cp35m-win_amd64.whl

其他版本替换文件名即可。

  • 安装pyOpenSSL

官方网站下载wheel文件,https://pypi.python.org/pypi/pyOpenSSL#downloads,如当前最新版本名称是pyOpenSSL-16.2.0-py2.py3-none-any.whl,下载后安装即可。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install pyOpenSSL-16.2.0-py2.py3-none-any.whl
  • 安装Twisted

同理,http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted下载wheel文件,利用pip安装即可。 如Python 3.5版本,Windows 64位系统,下载 Twisted‑17.1.0‑cp35‑cp35m‑win_amd64.whl,然后pip安装。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install Twisted‑17.1.0‑cp35‑cp35m‑win_amd64.whl
  • 安装pywin32

从官方网站 https://sourceforge.net/projects/pywin32/files/pywin32/Build%20220/ 下载对应版本的安装包安装即可。

  • 安装Scrapy

最后安装Scrapy即可,依然使用pip,命令如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install Scrapy

CentOS、RedHat、Fedora

  • 依赖库安装

确保一些必须的类库已经安装,运行如下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo yum groupinstall development tools
sudo yum install python34-devel epel-release libxslt-devel libxml2-devel openssl-devel
  • 安装Scrapy

利用pip安装Scrapy即可,运行如下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install Scrapy

Ubuntu、Debian、Deepin

  • 依赖库安装

首先确保一些必须的类库已经安装,运行如下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo apt-get install build-essential python3-dev libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zlib1g-dev
  • 安装Scrapy

利用pip安装Scrapy即可,运行如下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install Scrapy

虽然腾讯云没有Mac系统,不过在这里还是加上MacOS的安装。

Mac OS

  • 依赖库安装

在Mac上构建Scrapy的依赖库需要C编译器以及开发头文件,它一般由Xcode提供,运行如下命令安装即可:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
xcode-select --install
  • 安装Scrapy

利用pip安装Scrapy即可,运行如下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install Scrapy
验证

安装之后,在命令行下输入scrapy,如果出现类似下方的结果,就证明Scrapy安装成功。

常见错误

  • pkg_resources.VersionConflict: (six 1.5.2 (/usr/lib/python3/dist-packages), Requirement.parse('six>=1.6.0'))

six包版本过低,six包是一个提供兼容Python2和Python3的库,升级six包即可。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo pip3 install -U six
  • c/_cffi_backend.c:15:17: fatal error: ffi.h: No such file or directory

缺少Libffi这个库。什么是libffi?“FFI” 的全名是 Foreign Function Interface,通常指的是允许以一种语言编写的代码调用另一种语言的代码。而Libffi库只提供了最底层的、与架构相关的、完整的”FFI”。

安装相应的库即可。

UbuntuDebian

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo apt-get install build-essential libssl-dev libffi-dev python3-dev

CentOS、RedHat:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo yum install gcc libffi-devel python-devel openssl-devel
  • ImportError: No module named 'cryptography'

这是缺少加密的相关组件,利用pip安装即可。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo pip3 install cryptography
  • ImportError: No module named 'packaging'

缺少packaging这个包,它提供了Python包的核心功能,利用pip安装即可。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo pip3 install packaging
  • ImportError: No module named 'appdirs'

缺少appdirs这个包,它用来确定文件目录,利用pip单独安装即可。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo pip3 install appdirs

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
scrapy安装步骤_scrapy安装教程
Scrapy的安装有多种方式,它支持Python2.7版本及以上或Python3.3版本及以上。下面说明Python3 环境下的安装过程。 Scrapy依赖的库比较多,至少需要依赖库有Twisted 14.0,lxml 3.4,pyOpenSSL 0.14。而在不同平 台环境又各不相同,所以在安装之前最好确保把一些基本库安装好,尤其是Windows。
全栈程序员站长
2022/10/02
3.9K0
scrapy安装步骤_scrapy安装教程
Python 爬虫框架Scrapy安装汇总
练习了基本的操作之后,当然就要找框架来进行爬虫实验啊。于是就在网上找Windows 64安装Scrapy的方法,查到的都是非常繁琐的安装方式,由于Scrapy有很多个依赖,所以在安装Scrapy之前你就要先安装他的所有的依赖啊,下面列举出部分依赖库:
Lansonli
2021/10/09
6560
Python3网络爬虫实战-10、爬虫框
我们直接用 Requests、Selenium 等库写爬虫,如果爬取量不是太大,速度要求不高,是完全可以满足需求的。但是写多了会发现其内部许多代码和组件是可以复用的,如果我们把这些组件抽离出来,将各个功能模块化,就慢慢会形成一个框架雏形,久而久之,爬虫框架就诞生了。
py3study
2020/01/03
1.3K0
Python3网络爬虫实战-10、爬虫框
爬虫框架Scrapy总结笔记
由于工作需要,学习一下爬虫框架,在网上看了别人的笔记和教学视频,想总结一下便于以后复习用,然后和大家分享一下。
木野归郎
2021/03/11
5020
爬虫框架Scrapy总结笔记
Scrapy:安装方法
2.scarpy需求lxml,OpenSSL,Twisted库一般系统自带,也可用以下方法安装:
新码农
2020/04/17
1.3K0
Scrapy:安装方法
爬虫框架 Scrapy 知识点简介
Scrapy框架因为功能十分强大,所以依赖很多库,不能直接安装,需要先安装依赖库,因为我的电脑在Windows下,所以这里展示Windows下的安装方法(如果有其他平台的需要,欢迎给我留言我在发出来)。
数据STUDIO
2022/04/11
3330
爬虫框架 Scrapy 知识点简介
[191]python3.6下scrapy框架的安装
于是开始问度娘应该怎样安装,看了几篇博客,虽然和我的问题不十分相同,但是也受到了启发,知道应该怎样解决我的问题了。解决问题的过程总结如下:
周小董
2022/04/12
3220
[191]python3.6下scrapy框架的安装
Python3网络爬虫(五):Python3安装Scrapy
本文介绍了如何利用Python3和Scrapy框架实现网络爬虫,并对Scrapy的下载、安装及使用过程进行了详细说明。同时还提供了Windows环境下Scrapy安装过程中遇到的错误及解决办法,对于初学者学习Scrapy具有一定的参考价值。
Jack_Cui
2017/12/28
9670
Python3网络爬虫(五):Python3安装Scrapy
Python最火爬虫框架Scrapy入门与实践,豆瓣电影 Top 250 数据采集
Python爬虫框架Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍。所谓的框架就是一个已经被集成了各种功能(高性能异步下载,队列,分布式,解析,持久化等)的具有很强通用性的项目模板。对于框架的学习,重点是要学习其框架的特性、各个功能的用法即可。
二爷
2020/07/22
2.4K0
Python最火爬虫框架Scrapy入门与实践,豆瓣电影 Top 250 数据采集
使用Scrapy框架爬取土巴兔
我们为什么要使用Scrapy,而不使用其他爬虫框架,除了成熟稳定之外,还有很多其他优势。
conanma
2021/11/01
5710
scrapy安装步骤_scrapy官网
安装scrapy过程中出现各种包安装错误,所以自己一直看教程知道scrapy安装需要准备好各种环境 。
全栈程序员站长
2022/10/02
7.4K0
scrapy安装步骤_scrapy官网
error: Microsoft Vis
  安装scrapy要先安装前面四个,不然就会出现 errror:Microsoft Visual C++ 14.0 is required 错误。
py3study
2020/01/16
6920
error: Microsoft Vis
Python爬虫解析库安装
抓取网页代码之后,下一步就是从网页中提取信息。提取信息的方式有多种多样,可以使用正则来提取,但是写起来相对比较烦琐。这里还有许多强大的解析库,如 lxml、Beautiful Soup、pyquery 等。此外,还提供了非常强大的解析方法,如 XPath 解析和 CSS 选择器解析等,利用它们,我们可以高效便捷地从网页中提取有效信息。
仲君Johnny
2024/01/31
2860
Python爬虫解析库安装
Python爬虫:Scrapy框架的安装和基本使用
大家好,本篇文章我们来看一下强大的Python爬虫框架Scrapy。Scrapy是一个使用简单,功能强大的异步爬虫框架,我们先来看看他的安装。
QQ1622479435
2018/10/19
6760
Python | Python学习之初识Scrapy
Scrapy使用 Python 实现的一个开源爬虫框架,Scrapy基于 twisted这个高性能的事件驱动网络引擎框架,Scrapy爬虫拥有很高的性能。
咸鱼学Python
2019/10/09
5500
Python | Python学习之初识Scrapy
Scrapy安装教程(图文)
一、直接下载 在“开始”里面输入“cmd”进入命令提示符窗口,然后输入pip install scrapy看看下载是否成功
全栈程序员站长
2022/11/04
2.5K0
Scrapy安装教程(图文)
Scrapy学习笔记一:安装
Ubuntu / Debian Linux 1. 更新软件列表 sudo apt-get update 2. 安装依赖库 sudo apt-get install python-pip python-lxml python-crypto python-cssselect python-openssl python-w3lib python-twisted python-dev libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev 3. 安装Scr
白墨石
2021/01/13
2900
Windows下安装Scrapy方法及常见安装问题总结——Scrapy安装教程
这几天,很多朋友在群里问Scrapy安装的问题,其实问题方面都差不多,今天小编给大家整理一下Scrapy的安装教程,希望日后其他的小伙伴在安装的时候不再六神无主,具体的教程如下。
Python进阶者
2019/01/13
5790
Windows下安装Scrapy方法及常见安装问题总结——Scrapy安装教程
分布式爬虫搭建系列 之一------python安装及以及虚拟环境的配置及scrapy依赖库的安装
首先,根据你的Windows版本(64位还是32位)从Python的官方网站下载Python 3.5对应的64位安装程序或32位安装程序(网速慢请移步国内镜像)或者通过输入网址https://www.python.org/downloads/选择要下载的版本,然后,双击运行下载的EXE安装包:
wfaceboss
2019/04/08
5730
分布式爬虫搭建系列 之一------python安装及以及虚拟环境的配置及scrapy依赖库的安装
python3.8安装scrapy_安装scrapy
抓取网站的代码实现很多,如果考虑到抓取下载大量内容,scrapy框架无疑是一个很好 的工具。下面简单列出安装过程。PS:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。
全栈程序员站长
2022/11/04
7930
python3.8安装scrapy_安装scrapy
相关推荐
scrapy安装步骤_scrapy安装教程
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验