21世纪,人工智能时代已经来临,人工智能人才缺口已达百万,AI初级中级工程师年薪达30万 ~ 50万,高到没朋友!
计算机视觉、自然语言处理等前沿应用领域更是面临巨大的人才缺口。
留学悉尼的小伙伴们,肯定已经摩拳擦掌,准备利用暑假好好磨练一下自己的编程技能啦,但是面对那么多的岗位,我们到底应该如何选择呢?
别担心,Dueape帮大家选取了seek上关于python的工作岗位信息,做了一个全面的数据分析,拿去拿去~
话不多说,一起来看!
1
网页分析
点击进入seek后搜取python关键字
我们发现他的网页是静态的嘛,简直不要太简单了,翻到页面后也是需要点击的,直接模拟创建打开页面就可以找到我们的目标啦。
2
爬取页面
模拟好浏览器的头部信息,并初始化好我们的爬虫主体信息,我们的小爬虫就可以源源不断地请求到我们所需要的页面啦。
分析:
a. 经过网页的三次翻页我们发现,seek的网页就是由page=n来决定的网页页面数。
b. 只要不断通过getlink方法不断取得我们想要的jobtitle头部链接就可以轻松得到数据啦。
3
获取信息
接着我们来到主页面,贪婪的掠取我们想要的信息:
小孩子才做选择,作为一个成年人......
我全要!
如法炮制上一步使用正则表达式提取所有信息:
4
数据分析
我们这里爬取数据后经过预处理剩余的有效的当月近期的工作数据435条。关键字段11640行工作描述。
由于我们在最后保存成.csv 格式,打开Excel可以直接查看一下。(需要数据和源码的小伙伴可以加微信向管理索要)
通过这些工作数据,我们得出了以下4点结论,供大家参考:
a
关于工作种类的饼图
不难看出绝大工作还是全职,对于留学生来说,争夺最后的兼职和暑假实习就更加严峻。
b
关于工作类型的饼图
在我们整合后的工作方向上主要还是由python开发为主。
在网络方向上network,web,IT,与数据科学data大类分庭抗礼,在类别分析中other部分主要是consultant等顾问职位,并不适合学生增长工作经验。
c
关于工作地点的位置数量柱状图
无一例外,在中央商务区写字楼地区的工作机会以绝对优势占据第一,说明住在城区也是有好处滴~
d
关于分析工作描述的词云
(猜猜看这个词云像什么形状?赶快在评论区分享吧~)
从词频统计的词图可以看出,虽然在jobtitle和jobfield中不占最大优势比例的data方向上,公司对于新人的要求上有最大的要求,接着是exp经验和strong、team等关键字。
并没有提到曾经以为重要的“系统”、“架构”等高水平名词。希望能给大家在以后工作和学习中更清晰的思路。
看了这么多,是不是觉得干货满满呢~
除此之外,DueApe还为大家准备了一份大礼哦
当当当当!
python小白先导课
免费的哦,免费的哦,免费的哦
重要的事情说三遍!
领取专属 10元无门槛券
私享最新 技术干货