Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >5天破10亿的哪吒,为啥这么火,Python来分析

5天破10亿的哪吒,为啥这么火,Python来分析

作者头像
CDA数据分析师
发布于 2019-08-12 11:59:39
发布于 2019-08-12 11:59:39
4640
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

作者:金牌小编

本文转自公众号:菜鸟学Python

不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做《哪吒之魔童降世》的动漫电影。大家无一例外,都说非常的好看。

看一下最近的微信搜索指数,比火热的电视剧“亲爱的热爱的”搜索指数要高出近6倍,比迪斯尼的“狮子王”要高出22倍,确实非常火。

小编抱着好奇的心态,去猫眼上看了一下,结果显示在接近84万人评分的情况下,评分竟然高达9.7分。看了这确实是一部好剧,也值得我去爬取一下大家的评论,并进行一波分析,从中发现一些值得关注的东西。

1

数据的获取

首先是关于数据的爬取,数据的爬取相对简单,大家只需要打开猫眼网里面这部片子的网址,便可以看到下面的影评。在开发者模式中,切换到移动端,便可以看到影评,如果大家仔细观察,可以发现,影评是动态加载的,如下图所示:

动态加载的话,大家只需要在network下的XHR内,仔细观察,便可以发现网页动态加载的json数据,也就是我们要爬取的数据。如下图所示。

(动态图)

接下来就是利用简单的爬虫进行爬取了,部分代码如下图所示。

爬取的过程其实很简单,通过手机端的链接进去,然后循环爬取,用bs进行解析即可,然后把保存为json文件。

2

数据的分析

爬取完数据之后,接下来便是数据的分析,上述的数据中,大概有5000多条。(先爬5000条,高并发几十万条需要用分布式爬虫才可以)

小编爬到了评论者的性别(0为未知,1代表男,2代表女)、等级、所在城市、评分以及评语。

3

影评分析

用Python做可视化分析的工具很多,目前比较轻量级好用的库是pyecharts,在公众号里面多次讲解过它的用法,这里就不详细重复了!我们看快速看一下近5000条影评的数据可视化结果:

1)总体评分

《哪吒》在猫眼中的总体评分为9.7分,这个分数无疑是非常高的。超过了国产动画 比如“白蛇传”。从评分分布来看,大多数评分都给了满分,占总数的86.5%,其次是4.5分,占总数的7.7%,给到3分及以下的人非常少,还不足总人数的5%,要知道众口难调,这个差评比例在电影中可以算非常低的了。

2)性别差异

通常来说这种国产动画的“大片”比较符合大众口味,从评论者性别分布数据来看,虽然有接近一半的人不愿透露性别,但从已知数据判断,观影男女比例约为1:1多一点,女性观众的比例稍微高一点。

3).城市分布

接下来小编分析了评论者所在的城市分布。首先是直方图的来粗略的展示前十大热门的影迷城市,如下图所示:

直方图的展示不是很直观也不全面,因此,小编采用地图的形式,为大家更加直观的进行展示,由于观影者的城市地理位置可能没有出现在程序的设置中,因此,小编只选取了观影城市最多的前八十个城市作为动态展示,如下图所示:

(动态图)

4).评论内容

首先整合评论内容,然后利用wordcloud库绘制词云图,从词云分析情况来看,满屏的“好看”,“不错”,“特效”等赞美的词语,与以往的电影不同的是,“剧情”,“故事”等字眼也特别醒目。

其实这部大片,算是国产动画电影里面的大制作,电影制作花了5年的时间,剧本改了60几个版本,制作的团队高达千人。电影里面有1800多个镜头,有1300多个是特效,这样的用心之作难怪上映之后,口碑爆棚啊!

而且导演还有很多致敬 星爷的地方,比如太乙真人那段,很像功夫片段里面的桥段,最搞笑的还有一本《神仙的自我修养》,好了不剧透了,大家赶紧去电影院看一下吧。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
用Python分析国庆最火的电影,20万数据分析
国庆小长假我都没有更新,让大家都好好休息一下,也为2019的尾声蓄力,最近计划出一个爬虫系列的文章, 让每个人都能学会爬虫,敬请期待.
龙哥
2019/10/10
6330
用Python分析国庆最火的电影,20万数据分析
爬取《悲伤逆流成河》猫眼信息 | 郭敬明五年电影最动人之作
知道《悲伤逆流成河》上映还是在qq空间看见学弟发了说说,突然想起初中追小四的书,每天看到晚上10点多,昨天看了枪版的《悲伤逆流成河》,整个故事情节几乎和小说一模一样,当然缩减是避免不了的,最大的不一样的是原著里的易遥是跳楼自杀的,而电影里路遥是在众人的"舌枪唇剑"、幸灾乐祸的眼睛下,带着不甘与怨恨跳河自杀的,最后竟然…我就不剧透了,整部剧大概一个小时四十分钟下来全程无尿点,昨天就是枪版的我都看了两遍…(正打算找人去电影院再看一遍),也是看了第一遍,才让我想写这篇充满技术+情感的文章。
sergiojune
2018/10/23
8190
爬取《悲伤逆流成河》猫眼信息 | 郭敬明五年电影最动人之作
分析 |《狄仁杰之四大天王》影评分析(爬虫+词云+热力图)
作为徐老怪的忠实影迷,《狄仁杰之四大天王》肯定是要去看的,看豆瓣评分和前两部相差不多,但其实作者本人并不是很喜欢前两部,所以在犹豫要不要去看,于是简单去分析了一下《狄仁杰》的影评。
灯塔大数据
2018/08/28
5180
分析 |《狄仁杰之四大天王》影评分析(爬虫+词云+热力图)
哪吒票房逼近30亿,从豆瓣短评简单分析人们对哪吒的态度
看前点个关注吧! 目录 前言 分析 具体步骤 登录 爬取与存储 可视化分析 结语 前言 暑期档电影惨淡,但随着哪吒爆红开拓了新局面。这也是国产动画的首次爆红。在哪吒刚出,笔者以为最多10亿就算不错的
bigsai
2019/09/24
3720
哪吒票房逼近30亿,从豆瓣短评简单分析人们对哪吒的态度
花木兰到底好看不,我用Python爬取了几万条评论!
对于神仙姐姐刘亦菲,估计很多码农都很喜欢,小编也非常喜欢她。从一开始的金粉世家里面的青涩的白秀珠,到天龙八部的神仙姐姐王语嫣,再到仙剑奇侠传里面的赵灵儿,后来挑战四大名捕里面的无情,演技也是越来越好。
龙哥
2020/09/27
4700
花木兰到底好看不,我用Python爬取了几万条评论!
分析了《无问西东》17万+评论数据,我发现这些信息
2019即将开启,一大波新电影又将上线争芳斗艳,恰如年初《无问西东》刚上线时的场景一样。
luanhz
2020/03/31
6400
分析了《无问西东》17万+评论数据,我发现这些信息
十万条评论告诉你,给《流浪地球》评1星的都是什么心态?
2019年贺岁档电影热闹得不亦乐乎,其中大刘作品改编的《流浪地球》更是凭口碑一路低开高走,在黄渤、沈腾、韩寒、星爷、成龙大哥和小猪佩奇众星云集的贺岁档电影中脱颖而出,以7天23.47亿成为了票房冠军。
Python数据科学
2019/07/19
5820
《囧妈》口碑扑街?Python告诉你观众这次为何不买账了
导读:今天我们就来聊聊另类春节档的唯一一部电影《囧妈》,Python技术部分可以直接看第三部分。
IT阅读排行榜
2020/02/20
4050
《囧妈》口碑扑街?Python告诉你观众这次为何不买账了
《寄生虫》横扫奥斯卡,Python告诉你这部电影到底好在哪儿?
【导语】:今天我们横扫本届奥斯卡的韩国电影《寄生虫》,Python技术部分可以直接看第四部分。
数据森麟
2020/02/20
5210
《寄生虫》横扫奥斯卡,Python告诉你这部电影到底好在哪儿?
2019电影票房大盘点
2019年,可以说是中国电影的大年,众多国产巨制纷纷上映,让广大影迷们又再次看到了中国电影的希望,今天我们就用数据来说一说这堪称辉煌的2019中国影坛。
周萝卜
2020/05/22
5340
手把手教你用Python分析豆瓣电影——以《我不是药神》《邪不压正》为例
《我不是药神》是由文牧野执导,宁浩、徐峥共同监制的剧情片,徐峥、周一围、王传君、谭卓、章宇、杨新鸣等主演 。影片讲述了神油店老板程勇从一个交不起房租的男性保健品商贩程勇,一跃成为印度仿制药“格列宁”独家代理商的故事。
CDA数据分析师
2018/07/30
1.6K1
手把手教你用Python分析豆瓣电影——以《我不是药神》《邪不压正》为例
[数据案例] 2019电影票房大盘点
憋在家中数日的你,是否还记得去年春节期间,流浪地球票房霸榜的场景?春节档本是电影行业全年的两大档期之一,只可惜现在大家都只能乖乖在家待着,原本计划上映的影片也纷纷撤档。
Crossin先生
2020/02/21
6290
[数据案例] 2019电影票房大盘点
Python"大"数据分析,《庆余年》为啥这么火
今年末尾上映的古装剧《庆余年》可谓是赚足了眼球,号称投资了7个亿,集齐陈道明吴刚袁泉等一票老戏骨,实力演员张若昀李沁主演,又有新顶流肖战做配,在播出后没多久便圈粉无数
用户6888863
2020/02/18
4550
Python"大"数据分析,《庆余年》为啥这么火
用Python网络爬虫带你解析《李焕英》为什么值54亿票房
要说今年最出圈的词汇,《你好,李焕英》绝对算是最热的黑马之一。不鸣则已,一鸣惊人,这部优秀的作品更是让贾玲荣获“全球票房最高女导演”的称号。
前端皮皮
2021/04/16
5740
今天要去看电影《八佰》了,我用Python爬了14.4万条评论看看大家都在聊啥~
由于今年新冠疫情,电影院也是在最近一段时间才“解封”,《八佰》算是“开年”截止目前热度最高的电影了。朋友圈很多人看完容易沉浸在其气氛中、激发心中的民族感,当然也有一些网友持负面看法。那究竟大家都在有着什么样的观后感呢,我们来通过评论数据看看给予不同评分的观众都怎么说吧。
可以叫我才哥
2021/08/05
4810
3天破9亿!上万条评论解读《西虹市首富》是否值得一看
作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据
Python技术与生活认知的分享
2018/08/16
4830
3天破9亿!上万条评论解读《西虹市首富》是否值得一看
用数据说话为何《一出好戏》首日就能拿下1.5亿票房.
本人作为黄渤的粉丝,《一出好戏》当然是必看无疑呀。在今天正式观看之前,先来通过猫眼的影评来分析下网友对它的反馈。
龙哥
2018/10/22
5170
用数据说话为何《一出好戏》首日就能拿下1.5亿票房.
Python告诉你:8.3分口碑炸裂!潘粤明版《鬼吹灯》到底好看在哪儿?
作为热门的国产大IP之一,天下霸唱的《鬼吹灯》系列作品已被翻拍数次,热度始终高居不下。
CDA数据分析师
2020/05/01
6920
数说成龙电影|数据告诉你,成龙大哥真的老了吗
最近的电影《哪吒》绝对是风靡全国,各种“我命由我不由天”,激励着平民大众。而《上海堡垒》则彻底扑街,鹿晗也跌落神坛,流量不再。而老大哥成龙的新片《龙牌之谜》也在日前悄悄上映了,之所用悄悄是因为电影并没有做过多的宣传,低调上映。但是上映之后的口碑却不敢恭维,好多影迷都说,大哥老了,也开始持续拍烂片了。今天,我们就来分析下历年成龙的电影得分数据和《龙牌之谜》的评论,用数据来告诉你,真的是大哥老了,打不动了吗?
周萝卜
2019/09/03
6530
数说成龙电影|数据告诉你,成龙大哥真的老了吗
Python大佬爬取了10亿票房的《西虹市首富》热评,一起来解读吧!
纵观近几年的国产电影市场,“开心麻花“似乎已经成为了票房的保证。从《夏洛特烦恼》、《羞羞的铁拳》到最新上映的《西虹市首富》都引爆了票房。本期我们会根据从猫眼电影网爬取到的上万条评论为你解读《西虹市首富》是否值得一看。
Python进阶者
2019/10/15
7180
Python大佬爬取了10亿票房的《西虹市首富》热评,一起来解读吧!
推荐阅读
用Python分析国庆最火的电影,20万数据分析
6330
爬取《悲伤逆流成河》猫眼信息 | 郭敬明五年电影最动人之作
8190
分析 |《狄仁杰之四大天王》影评分析(爬虫+词云+热力图)
5180
哪吒票房逼近30亿,从豆瓣短评简单分析人们对哪吒的态度
3720
花木兰到底好看不,我用Python爬取了几万条评论!
4700
分析了《无问西东》17万+评论数据,我发现这些信息
6400
十万条评论告诉你,给《流浪地球》评1星的都是什么心态?
5820
《囧妈》口碑扑街?Python告诉你观众这次为何不买账了
4050
《寄生虫》横扫奥斯卡,Python告诉你这部电影到底好在哪儿?
5210
2019电影票房大盘点
5340
手把手教你用Python分析豆瓣电影——以《我不是药神》《邪不压正》为例
1.6K1
[数据案例] 2019电影票房大盘点
6290
Python"大"数据分析,《庆余年》为啥这么火
4550
用Python网络爬虫带你解析《李焕英》为什么值54亿票房
5740
今天要去看电影《八佰》了,我用Python爬了14.4万条评论看看大家都在聊啥~
4810
3天破9亿!上万条评论解读《西虹市首富》是否值得一看
4830
用数据说话为何《一出好戏》首日就能拿下1.5亿票房.
5170
Python告诉你:8.3分口碑炸裂!潘粤明版《鬼吹灯》到底好看在哪儿?
6920
数说成龙电影|数据告诉你,成龙大哥真的老了吗
6530
Python大佬爬取了10亿票房的《西虹市首富》热评,一起来解读吧!
7180
相关推荐
用Python分析国庆最火的电影,20万数据分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档