前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >在知乎上学 Python - 爬虫篇

在知乎上学 Python - 爬虫篇

作者头像
Crossin先生
发布2019-09-18 11:16:21
1.6K0
发布2019-09-18 11:16:21
举报
文章被收录于专栏:Crossin的编程教室

知乎是个好地方。虽然近年来,为了吸引更多的用户,知乎的定位与早期略有点偏离。但从内容质量和专业性来说,知乎仍然是国内数一数二的知识型社区。不少同学都是通过知乎发现了我们编程教室,我自己也经常会通过知乎去寻求一些专业知识的解答和参考。

之前,为了让大家能更好地挖掘知乎上有价值的信息,我们做了一个索引,把编程入门相关的一些问答和文章做了整理:

在知乎上学 Python - 入门篇

文中曾立下FLAG说之后会整理爬虫、数据分析、机器学习等方面的索引,然而却一拖再拖。好在现在,有同学帮我们做了后续整理,今天就把“爬虫篇”分享给大家。


注意:由于微信文中不能直接跳转外部链接,因此建议点击文末的“阅读原文”,收藏知乎原文。


有很多人正在入门Python爬虫,学习Python爬虫。在这个过程中,会遇到很多难题,许多小伙伴都会去寻找答案,但是因为答案的纷繁复杂和种类多样,往往要花上好些时间。

所以我通过整理知乎上关于Python爬虫的精彩回答文章和教程,制作一篇关于Python爬虫的索引,包括:

入门指南-教程资源-框架工具-爬虫实例-专栏索引

大家有什么好的建议和资源也可以留言提出。


入门指南: 1.如何入门Python爬虫?—谢科的回答 https://www.zhihu.com/question/20899988/answer/24923424

(简介:爬虫怎么工作以及怎么在python实现。)

2.爬虫基本原理

https://zhuanlan.zhihu.com/p/35324806

(简介:给有一些有python基础,但是对爬虫一无所知的人)

3.Python爬虫入门

第一讲:Python爬虫|Python爬虫入门(一):基本

https://zhuanlan.zhihu.com/p/21377121?refer=xmucpp

第二讲:Python爬虫|Python爬虫入门(二):请求

https://zhuanlan.zhihu.com/p/21394571

第三讲:Python爬虫|Python爬虫入门(三):解析

https://zhuanlan.zhihu.com/p/21442500

第四讲:Python爬虫|Python爬虫入门(四):储存

https://zhuanlan.zhihu.com/p/21452812

(简介:本爬虫系列入门教程假设读者仅有一点点Python基础或者近乎为零的基础。如果是有Python基础的可以跳过一些对于Python基本知识的补充。)


教程资源:

书籍:

1.一份Python爬虫电子书 (路人甲)

https://zhuanlan.zhihu.com/p/28865834

(简介:这本书主要内容是Python入门,以及Python爬虫入门和Python爬虫进阶)

2.问题:求大神们推荐Python入门书籍

https://www.zhihu.com/question/38801925/answer/184406876

(简介:Python爬虫方面入门书籍推荐)

教程:

系列教程:

1.Python爬虫学习系列教程

https://zhuanlan.zhihu.com/p/25949099

(简介:学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫)

2.Python爬虫教程(一)使用request+Beautifi

https://zhuanlan.zhihu.com/p/35493091

Python爬虫教程(二)使用request+正则re批量下载好听轻音乐网歌曲https://zhuanlan.zhihu.com/p/35528714

3.python爬虫初探(一):爬虫的基本结构

https://zhuanlan.zhihu.com/p/32652572

python爬虫初探(二):URL管理器和下载器

https://zhuanlan.zhihu.com/p/32673371

python爬虫初探(三):HTML解析器

https://zhuanlan.zhihu.com/p/32675668

python爬虫初探(四):数据存储器

https://zhuanlan.zhihu.com/p/32697330

拓展教程:

1.爬虫万金油,一鹅在手,抓遍全球:goose 简介https://zhuanlan.zhihu.com/p/46595420

2.这个男人让你的爬虫开发效率提升8倍

https://zhuanlan.zhihu.com/p/38466193

3.Python 抓取网页乱码原因分析

https://zhuanlan.zhihu.com/p/21057822

4.干了这碗“美丽汤”,网页解析倍儿爽

https://zhuanlan.zhihu.com/p/58445021

进阶拓展:

进阶:

1.Python爬虫进阶

https://www.zhihu.com/question/35461941/answer/192693594

https://www.zhihu.com/question/35461941/answer/72909421

(简介:爬虫无非分为这几块:分析目标、下载页面、解析页面、存储内容)

2.“百行代码”实现简单的Python分布式爬虫

https://zhuanlan.zhihu.com/p/26045460

(简介:进阶知识)

拓展:

1.利用爬虫技术能做到哪些很酷很有用的事情?

https://www.zhihu.com/question/27621722

2.Python爬虫学到什么样就可以找工作了https://www.zhihu.com/question/61103114/answer/183926752

3.从python爬虫,到更爱这个世界

https://zhuanlan.zhihu.com/p/32711505

4.Python爬虫和情感分析简介

https://zhuanlan.zhihu.com/p/20359324

5.你是如何开始能写Python爬虫?

https://www.zhihu.com/question/21358581/answer/274132025

爬虫资源:

1.一个很“水”的Python爬虫入门代码文件

https://zhuanlan.zhihu.com/p/22982208

2.156个Python网络爬虫资源!

https://zhuanlan.zhihu.com/p/28407245

3.可能是最全面的75个Python爬虫资源

https://zhuanlan.zhihu.com/p/27985429

学习经验: 1.用Python写爬虫时应该注意的坑?

https://www.zhihu.com/question/49296232/answer/368313956

2.Python3网络爬虫学习建议?

https://www.zhihu.com/question/41277528/answer/95885043

3.Python爬虫知识点梳理

https://zhuanlan.zhihu.com/p/29523349

4.常用的 Python 爬虫技巧

https://zhuanlan.zhihu.com/p/23088379

5.如何优化Python爬虫的速度?

https://www.zhihu.com/question/20145091/answer/618321662

6.Python爬虫—破解JS加密的Cookie

https://zhuanlan.zhihu.com/p/25957793

7.主流网站 Python 爬虫模拟登陆方法汇总

https://zhuanlan.zhihu.com/p/59733826

8.三步走,教你定制自己的个性Python爬虫

https://zhuanlan.zhihu.com/p/23178014

9.Python爬虫传送post请求要携带哪些参数?https://www.zhihu.com/question/60256922/answer/174211193


框架工具:

框架: 1.Python有哪些常见的、好用的爬虫框架?

https://www.zhihu.com/question/60280580/answer/617068010

2.一个极为简洁的Python爬虫框架

https://zhuanlan.zhihu.com/p/23017812

3.拥有属于自己的Python爬虫框架--练习编写多线程、协程爬虫框架https://zhuanlan.zhihu.com/p/24469566

工具:

1.10个爬虫工程师必备的工具了解一哈

https://zhuanlan.zhihu.com/p/54855072

(简介:工欲善其事必先利其器的道理相信大家都懂。)

2.推荐4个爬虫抓包神器

https://zhuanlan.zhihu.com/p/61980749

(简介:今天推荐4个HTTP代理工具通过抓包分析,帮助你还原APP背后的每个请求。)

3.爬虫必备工具,掌握它就解决了一半的问题

https://zhuanlan.zhihu.com/p/39340856

(简介:今天这篇文章不谈任何具体网站的抓取,只来说一个共性的东西:如何通过 Chrome 开发者工具寻找一个网站上特定数据的抓取方式。)

4.听说你好不容易写了个爬虫,结果没抓几个就被封了?

https://zhuanlan.zhihu.com/p/28726244

(简介:实现一个自动获取可用代理 IP 的接口。)


爬虫实例:

1.利用python爬取网易云音乐,并把数据存入mysqlhttps://zhuanlan.zhihu.com/p/34354440

2.python爬取20w表情包之后,从此你就成为了微信斗图届的高手https://zhuanlan.zhihu.com/p/66243518

3.如何让Python爬虫一天抓取100万张网页

https://zhuanlan.zhihu.com/p/65508954

4.Python爬虫告诉你上海房价有多高

https://zhuanlan.zhihu.com/p/40293278

5.Python爬虫入门 | 2 爬取豆瓣电影信息

https://zhuanlan.zhihu.com/p/32037625

6.Python爬虫一步步抓取房产信息

https://zhuanlan.zhihu.com/p/25713752

7.我用Python又爬虫了拉钩招聘,给你们看看2019市场行情https://zhuanlan.zhihu.com/p/65081383

8.爬虫爬了下知乎上的神回复,已笑趴~

https://zhuanlan.zhihu.com/p/46132179

9.一键下载:将知乎专栏导出成电子书

https://zhuanlan.zhihu.com/p/44918640

10.如何用Python抓抖音上的小姐姐

https://zhuanlan.zhihu.com/p/46396868

11.【招聘数据分析】Python就业前景如何

https://zhuanlan.zhihu.com/p/35027220


专栏索引:

Python爬虫索引:

1.如何入门爬虫(路人甲)

https://zhuanlan.zhihu.com/p/21479334

(简介:一个知乎大神整理的关于Python爬虫的索引,内容详细全面,结构完整。对于新手和正在学习的小伙伴是非常有帮助的。)

2.从零开始写Python爬虫(Ehco)

https://zhuanlan.zhihu.com/p/26673214

(简介:提供了实用的方法和建议)

3.自学入门 Python 优质中文资源索引

https://zhuanlan.zhihu.com/p/49798116

(简介:自学入门Python的整理,有关于Python爬虫的索引)

Python爬虫号推荐:

1.蚍蜉撼大树

https://www.zhihu.com/people/handashu/posts/posts_by_votes

(简介:Python爬虫之旅系列)

2.州的先生

https://www.zhihu.com/people/zmister/posts/posts_by_votes?page=2

(简介:python爬虫实战入门系列)

3.学习python的正确姿势

https://www.zhihu.com/people/xue-xi-pythonde-zheng-que-zi-shi-92/posts/posts_by_votes

(简介:Python爬虫实战系列)

4.不吃夹生饭

https://www.zhihu.com/people/bu-chi-jia-sheng-fan/posts

(简介:反反爬虫系列)

爬虫项目索引: 1.资源整理|32个Python爬虫项目让你一次吃到撑

https://zhuanlan.zhihu.com/p/27938007

(简介:32个爬虫项目)

2.GitHub上有哪些优秀的Python爬虫项目?

https://www.zhihu.com/question/58151047/answer/640461600

(简介:GitHub上优秀的Python爬虫项目)

3.23个Python爬虫开源项目代码,包含微信淘宝,豆瓣知乎,微博等

https://zhuanlan.zhihu.com/p/58851666

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Crossin的编程教室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 入门指南: 1.如何入门Python爬虫?—谢科的回答 https://www.zhihu.com/question/20899988/answer/24923424
  • 教程资源:
    • 书籍:
      • 教程:
        • 进阶拓展:
          • 爬虫资源:
            • 学习经验: 1.用Python写爬虫时应该注意的坑?
            • 框架工具:
              • 框架: 1.Python有哪些常见的、好用的爬虫框架?
                • 工具:
                • 爬虫实例:
                • 专栏索引:
                  • Python爬虫索引:
                    • Python爬虫号推荐:
                      • 爬虫项目索引: 1.资源整理|32个Python爬虫项目让你一次吃到撑
                      相关产品与服务
                      腾讯云 BI
                      腾讯云 BI(Business Intelligence,BI)提供从数据源接入、数据建模到数据可视化分析全流程的BI能力,帮助经营者快速获取决策数据依据。系统采用敏捷自助式设计,使用者仅需通过简单拖拽即可完成原本复杂的报表开发过程,并支持报表的分享、推送等企业协作场景。
                      领券
                      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档