消失了一周的 Kevin 归来了!本期我们不讲敏感的东西。因为*饭已经吃得很饱了。
本期讲讲一个朋友摇号(车牌)的辛酸史。以及我如何用 python 的技术(爬虫,数据分析,可视化)帮他找到原因,并让他更伤心的故事。
文中的数据仅供交流学习,不能作为其他使用依据。文中统一使用了第一人称我,其中摇号的是我朋友。
辛酸史
摇号次数又默默地执行了一次,
当初早知道摇六年都摇不到,还不如趁早又便宜买一块了。。
二月份个人中签率为0.54%!!
这是个什么概念??
平均情况要摇近 200 次才有可能中 1 次!!200 次,要 16.6 年!!
我估计那个时候,人们都开飞机出行了吧。。
大学同宿舍的老王,
参加工作后,把自行车换成了电瓶车,
摇了三次号后把电瓶车换成了小汽车,
天天载着不同的妹子到处兜风!!!
这才是青春岁月应有的记忆!!!!
而我参加工作后,从自行车换成电瓶车,从电瓶车直接换成了地铁!!!
再看着 100 万人摇 5000 多块牌照,
感觉我自己就是 5,000/1,000,000 里的分母中凑数的。
不行!我要跟命运做一回抗争,
我要找一找摇车牌的规律!!
说干就干!
获取数据
数据的获取可以用爬虫,也可以自己手工复制。这里假设使用复制的方法。实际上我使用的是爬虫。相关代码获取方法我会在文末说明。
网站目标就是某市的小客车增量指标网站。你可以用同样的方法分析你自己城市的网站。
于是我熟练地在浏览器输入了那个让我欢喜让我忧的,
一番行云流水操作下来后,
把每个中签者的姓氏,通过复制粘贴,复制粘贴,复制粘贴...
全部复制了下来。
接下来是数据分析阶段。
开始数据分析
请大家给我点时间~我要点一下,哪个姓氏老是中签...
经过三天三夜的努力,我终于点完了...
继续数据分析,亮出 python,做个词云图,可以看得更直观点:
分享代码:
再来个中签率最高前 20 个姓的条状图:
分享代码:
排名第一的真的是隔壁老王!!
后记
这个项目的完整代码(包括抓取地址,爬虫等)我会分享在麦叔Python星球,也会在哪里回答问题,和大家讨论。
我将会和麦叔把这次的数据做成一个放到微信小程序里,到时候各位小伙伴们也能查查自己姓氏的中签率情况了。
点赞是美德
你动动手就是对我最大的鼓励,如果对你有启发,请点赞,点在看,谢谢!
领取专属 10元无门槛券
私享最新 技术干货