首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >云上部署Python3爬虫--以腾讯云+Ubuntu为例

云上部署Python3爬虫--以腾讯云+Ubuntu为例

原创
作者头像
FesonX
发布于 2018-06-07 11:58:07
发布于 2018-06-07 11:58:07
2.5K0
举报
Album
Album

提示


以鄙人在GitHub上的辣鸡代码为例, 其他Scrapy的项目类似

本文同样适用于不使用云服务器的情形

前期准备(也可以到腾讯云开发者实验室体验)


1. 购买云服务器

选择一家云服务厂商, 购买云服务器, 目前国内主流服务均有提供学生版

如果第一次购买, 可以戳这个链接(逃 云服务器首购优惠

2. 下载Xshell, 使用ssh连接服务器

Xshell学生和家用是免费的, 下载地址http://www.netsarang.com/download/free_license.html

下载安装完成后, 使用系统分配的公网IP, 系统用户名和对应密码连接服务器.

在Github上克隆代码


代码语言:txt
AI代码解释
复制
git clone https://github.com/FesonX/JobCrawler.git

安装相关依赖


1. 安装Python3

项目使用Python3.6, 可以使用以下连接安装, 将文中的3.5改为3.6即可.

ubuntu14.04安装python3.5并且将其设置为python3默认启动

2. 使用virtualenv(也可以使用Anaconda或Pycharm管理)

Virtualenv允许多版本Python同时在电脑上共存, 安装完Python3及pip后

终端键入

代码语言:txt
AI代码解释
复制
# 安装
pip3 install virtualenv
# 创建虚拟环境
virtualenv spider-env
# 激活虚拟环境
source spider-env/bin/activate
# 退出
deactivate
3. 安装库依赖

因为Scrapy依赖Python.h,在安装库依赖前在终端键入

代码语言:txt
AI代码解释
复制
 sudo apt-get install libpython3.6-dev

然后安装依赖, 如果失败, 请逐条尝试

代码语言:txt
AI代码解释
复制
# 在JobCrawler/JobCrawler目录下
pip install -r requirements.txt
4. 安装MongoDB

参照以下连接安装

Install MongoDB Community Edition

运行爬虫

终端cd到项目根目录, 键入

代码语言:txt
AI代码解释
复制
# -o job.csv为可选参数, 加入则输出到指定文件中
scrapy crawl jobCrawler -o job.csv

扩展: 使爬虫开机运行


使爬虫在系统开机时自动运行, 对于许多系统来说,最简单 (如果不是最好的)的方式是使用rc.local文件

具体实现方式就交由你自己用搜索引擎探索啦


欢迎关注我的腾讯云社区账号

FesonX

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
定制女朋友微信公众号专属消息推送
最近在很多地方看到有做微信推送的帖子,可以给你的好朋友,女朋友,或者是兄弟,做一个专属的微信推送,设定一个时间,就可以在早上!或者是中午推送给他,一个关心的微信推送,例如是这样:
OY
2022/09/28
1.5K0
定制女朋友微信公众号专属消息推送
springboot整合微信公众号实现模版消息推送
在如今的互联网时代,微信已成为人们日常生活中不可或缺的一部分。微信公众号作为企业与用户互动的重要渠道,模版消息推送功能更是提升用户体验的关键之一。然而,对于很多开发者来说,如何将这一功能集成到现有的Spring Boot项目中,可能是一大挑战。本文将带你一步步实现这一目标,让你在实际开发中得心应手。
一只牛博
2025/05/31
2690
springboot整合微信公众号实现模版消息推送
微信公众号推送消息笔记
根据业务需要,开发一个微信公众号的相关开发,根据相关开发和整理总结了一下相关的流程和需要,进行一些整理和总结分享给大家,最近都在加班和忙碌,博客已经很久未更新了,打气精神,再接再厉,申请、认证公众号的一系列流程就不在这里赘述了,主要进行的是技术的分享,要达到的效果如下图:
stark张宇
2024/07/23
3990
微信小程序订阅消息推送
这几天在使用小程序的模板消息推送接口的时候,出现了个报错信息 “the formId is no longer available in develop or trial version”,去文档查看了一下才发现,模板消息功能在今年1月份已经下架了,现在统一都是使用订阅消息:
Chor
2020/07/21
3.2K0
尝试开发微信公众号消息推送功能并且和小程序关联
    之前写了几篇关于微信小程序的开发实践,总的来说没啥难度,感兴趣的请移步:使用Mpvue配合Weui开发面试题题库微信小程序,并且发布到正式环境,这一次我们来尝试开发一下微信公众号,那么公众号和小程序到底有什么区别呢?
用户9127725
2022/08/08
1.2K0
尝试开发微信公众号消息推送功能并且和小程序关联
一文入门微信公众号和小程序
抽出来一点时间,梳理一下微信公众号和小程序应用的实践,梳理总结的一点心得体会,公众号和小程序产品定位不同,公众号开发的权限和自由度比较高,消息事件类型丰富,而小程序更注重的体验,认证权限也相对严格,发布时需要审核和发版等等。
stark张宇
2024/12/17
6190
微信公众号模板消息接口
3、用户购买商品后,平台给用户发快递,可以通过模板消息将物流信息发送给用户(下单成功 -> 商家已发货 -> 收货成功)
很酷的站长
2022/12/28
2.1K0
微信公众号模板消息接口
【消息通知】用公众号模板消息怎么样?
我想在掘金逛了一段时间的朋友有看到关于自动签到等相关的文章吧,这里当然不是讲自动签到了,主要是说说在签到完后如何通知到我们签到的结果。在一些文章中我看到有人会使用Server酱(一个集成了多种消息渠道的推送服务),还有自己直接对接企业微信、钉钉群机器人的,对于不使用企微或钉钉的朋友就需要安装对应的软件才可以实现。当然还有一些专门接收消息通知的开源项目,感兴趣的可以了解一下~
前端小鑫同学
2022/12/26
1.6K0
【消息通知】用公众号模板消息怎么样?
微信公众号搭建chatgpt客服
<img src="https://p.ipic.vip/szfix6.png" alt="image-20230221195341050" style="zoom:50%;" />
Zephery
2023/02/26
4.3K0
微信公众号发布提醒(微信公众号模板消息接口)
灵感来源于学校的 每日健康日报,要求使用微信小程序进行每日健康打卡。所以此项目的功能类似于 QQ群机器人,或者是 每日闹钟。
全栈程序员站长
2022/07/26
13.7K0
微信公众号发布提醒(微信公众号模板消息接口)
微信消息推送神器pushplus介绍,让消息推送如此简单
原生实现微信消息推送需要申请公众号、成为开发者,实现微信公众号接入和消息推送等接口。
杨永贞
2022/10/25
13.7K0
微信消息推送神器pushplus介绍,让消息推送如此简单
微信公众号开发消息推送以及图文推送
(adsbygoogle =window.adsbygoogle ||[]).push({});
猿码优创
2019/07/28
2.1K0
微信公众号菜单点击发送天气预报
上一次介绍了如何为公众号添加关注自动回复的功能,这次我们来扩展一个比较实用的功能--天气查询
薛定喵君
2020/08/10
2.1K0
微信公众号模板消息
模板消息仅用于公众号向用户发送重要的服务通知,只能用于符合其要求的服务场景中,如信用卡刷卡通知,商品购买成功通知等。不支持广告等营销类消息以及其它所有可能对用户造成骚扰的消息。
神葳
2021/01/22
4.9K0
微信公众号是html页面吗,微信公众号网页开发
如果有相关接口权限无法开启,推荐使用:微信公众平台-开发-开发者工具-公众平台测试帐号开发
全栈程序员站长
2022/09/06
14.8K0
微信公众号是html页面吗,微信公众号网页开发
微信公众号平台开发测试怎么做_软件测试怎么测小程序
公众账号需要根据不同微信用户的不同消息做出不同的响应,所以每一个公众账号需要开发自己独有的系统,这套系统需要运行在公网环境下,但是我们通常普通开发人员没有这个条件,所以我选择了新浪云(天真的我以为是免费的,结果花了10个小洋)。
全栈程序员站长
2022/11/17
1.8K0
微信公众号平台开发测试怎么做_软件测试怎么测小程序
利用python对微信自动进行消息推送
cache_path = True表示开启缓存,这样在缓存生效的时间内可以避免每次启动程序都进行微信扫码了
py3study
2020/01/21
5.1K0
python之抓取微信公众号文章系列3
发现了一个非常有用的库 wechatsogou,听个名字你就大概能猜出是什么来的了,基于搜狗微信搜索的微信公众号爬虫接口,有了这个就可以玩起来了。
周小董
2019/03/25
3.5K0
python之抓取微信公众号文章系列3
最详细的微信公众号搭建一条龙
因为公众号最终是要面向外网使用的,那么就必须要有一台对外的服务器,推荐使用云服务器(自己做过内网穿透映射也可以,但是不方便)。
万少
2025/02/11
5430
最详细的微信公众号搭建一条龙
程序员的浪漫实现每天定时给Ta推送消息提醒保姆级超详细教程
前段阵子,小红薯平台刷到热门视频,程序员男朋友给她实现了每天定时推送消息给她,其中内容包含当地的天气情况、在一起多少天了,离她过生日还有多少天等信息,她开心不得于是发了小红薯平台觉得很浪漫,评论区一大堆人索要源码,于是本人看了下原理,其实就是Python写了一个脚本,利用微信测试号平台推送消息,毕竟此方案不需要额外准备域名以及服务器资源,简简单单就能实现,针对小白运行python程序简直太难了,于是最简单的exe可执行版本它来了,今天出一个超完整教程来满足评论区的所有朋友们,赶紧跟到教程学起来吧!
Lcry
2022/11/29
1.3K0
程序员的浪漫实现每天定时给Ta推送消息提醒保姆级超详细教程
推荐阅读
相关推荐
定制女朋友微信公众号专属消息推送
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档