前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >案例 |《长安十二时辰》详细数据分析

案例 |《长安十二时辰》详细数据分析

作者头像
Crossin先生
发布于 2019-10-14 14:55:00
发布于 2019-10-14 14:55:00
1.4K00
代码可运行
举报
运行总次数:0
代码可运行

今年有一部很火的剧:《长安十二时辰》,改编自“亲王”马伯庸的小说,易烊千玺、雷佳音参演。这部剧到底怎么样?我们用Python来尝试分析一下。

小说:

先从小说开始,小说原著中没有李必,而是李泌。

主要人物名字是从网上搜的:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
['李泌','张小敬','龙波','姚汝能','曹破延','元载','伊斯','葛老','崔器','徐宾','檀棋','闻染','鱼肠','王韫秀','毛顺','闻无忌','陈玄礼','永王','封大伦','太子','萧规','天子']

主要人物出场频次:

先看原著小说里每个主要人物出场的频次:

详细情况:

下图并非是出场前七名,只是因为我懒着去看电视剧截图,而又只找到这七个人的海报。

原著中男一男二男三出场次数各差一倍,也可以说只有一个男主角:张小敬,其他都是配角。李泌不到其二分之一(已统计其别称: 李司)。

社交关系:

由于Pyecharts不能以线条粗细表现交往频次,下图不能看出交往的密切程度,由于时间关系,也不准备换工具了。

其中只有张小敬与以上列举的人物全部都有所交往。

男主十二个时辰出场走势:

先普及一下,在古代一个时辰等于现代两个小时。每个时辰又分为初、正、末,每个对应现代四十分钟时长。

原著小说中自巳正开始到次日巳初结束:9:40开始到次日9:39结束,一天之内发生的事情。

未时两个男主都没怎么出场,作者可能在憋大招(做铺垫),申时就迎来了爆发。

可以看出张小敬绝大多数时辰都比李泌出场频次高。

张小敬酉时的起伏据说好像是因为他入狱了,我没看过这个小说不好分析。

小说词云:

主角就是主角,远超其他。

电视剧:

电视剧是优酷独播,所以选择的弹幕评论都是出自优酷。弹幕68万有余,评论近11万条。

弹幕、评论用户重叠度:

这里发现一个很有意思的现象:

评论、弹幕两种互动方式都参加的人数占比 不到2%,实锤这两个群体几乎不重合,各自爱着各自的表达方式。

弹幕:

人物人气排名:

根据该人物名字在68万条弹幕中出现的频率排名。考虑到李必扮演者,我原以为李必人气会远高于其他人物,没想到依然是张小敬稍多一些。

造成这个匪夷所思现象的原因其实已经在上面说过了:弹幕有很强的时效性,旧弹幕活不过一天就会被其他观看者的新弹幕替代。

距离这部剧完结已过去不少日子,李必扮演者的粉丝大部分应该都已经看完了这部剧,其粉丝当时发的的弹幕,很多已被其他人的弹幕替代了。现在的弹幕也更理性一些,也更能显示出真实人气。

下图为小说人物出场频率排名:

其中龙波当属最大黑马,出场排名中压根就没上榜,但是在电视剧里人气达到了第三名。而姚汝能就有点惨,本是出场第三,但是人气却掉到了最后一名。

因为龙波扮演者的很多油腻举动,造成龙波人气非常高?看过的说一下。

大佬:

分析弹幕时,见到了真大佬。这是一个大佬的弹幕数量,那些低于200的情况应该是被其他弹幕刷新了。

其中第41集发了512条弹幕,平均每5秒发一条弹幕,这个频率还能看得下去电视剧吗?

重点看一下这位大佬第41集的弹幕。去重之后还剩262条,大约每9秒手打一条弹幕。再看看质量:

弹幕数量高于 99.9% 以上用户,弹幕长度高出平均长度两倍有余,弹幕质量紧贴剧情发展。这个数量、长度,还能认认真真看电视剧结合剧情发弹幕,真大佬无疑。

考虑到弹幕的时效性,网上应该还有很多很多这些大佬。

评论:

优酷评论虽然相对于豆瓣质量差很多,但是评论是永久保存的,还是比弹幕更有价值。

弹幕中李必和张小敬人气相差无几,在评论里就能看出真实差距了。

雷佳音&易烊千玺人气:

为了避免统计疏漏,我做了很多关于这两位演员的功课,尽可能把所有别称都统计下来。

雷佳音别称:张小敬、小敬、大头、雷大头、大脸、雷大脸、脸盆、南瓜头、南瓜脸、冬瓜头、冬瓜脸。(非恶意抹黑,真实统计)

易烊千玺别称:李必、李司、千玺、王源、王俊凯、TF/tf、yyqx、弟弟、四字弟弟、哥哥、我家哥哥、老公。(王源、王俊凯应该是网友无意或故意叫错名字,老公 应该是网友...)

即便雷佳音才是男主角,演技也较好一些,但十万条评论里涉及易烊千玺的评论比雷佳音高了一倍,这个似乎挺符合正常逻辑,原因大家都知道。

每日评论走势:

每集评论走势图:

两幅图走势很相似!6月27日首播也就是在第一集评论迎来大爆发。

之后每过几天都会迎来一个小高峰,小高峰日期大多为更新时间,也就是在更新的四集/二集中的最后一集 评论迎来小高峰,看来大部分同学是一口气看完更新的剧集之后再发表评论。

最后于8月12日大结局时在第四十八集评论迎来第二波爆发。

按周细分评论走势:

周四平均评论数3738条远高于其他日子,因为这部剧是每周四更新。

但是为什么周一平均评论数也那么多,而周末又那么低?难道是周末出去玩,到上班了再补上周四没看的剧,上班摸鱼追剧系列?

每小时平均评论、弹幕量走势:

五十天的评论汇总,纵坐标为每小时发的评论数量、弹幕数量的平均数。弹幕、评论两条走势基本相同。

这部剧是会员20: 00更新,也就是在这个时间点附近,弹幕和评论量相继降到了最低,之后开始回升。

有意思的是两条曲线都是到22: 00 之后才开始快速回升,看来蹲点等更新的人并不多,大部分用户是选择洗漱完毕躺床上之后才开始愉快的追剧之旅。

而从20:00到次日凌晨4:00这个时间段 几乎是线性相关增长的趋势,表现出了现代人休息时间的高度不统一,躺下的时间非常不协调,且大多在00:00点之后才躺下看剧,还是要注意一下身体吖。

从4:00到9:00走势趋于平稳,但是数量并不低,也就是说在凌晨也有很多人追剧,作息时间有点乱。

自9:00开始追剧人数呈爆发增长,这个走势???9:00 应该是大多数人刚好开始上班的时间吧,上班摸鱼追剧实锤。

优酷用户:

本来只是想看看这部剧的情况,由于它的大火,这次拿到的数据很多。再加上这部电视剧是会员每周四更新四集,非会员每周一到周五更新一集,不是那种只有会员能看、或所有用户都能看的视频,所以用户数据很有代表性。

就顺带看看优酷用户的情况吧。

优酷用户等级分布:

优酷用户等级大多集中在40级以下,而由于优酷等级封顶100级,所以在100级处也积累了很多用户。

优酷会员等级划分情况:

提升等级分的途径只有开会员,其中连续包月+100分,连续包季+300分,连续包年+1600分,会员到期后每日降低20点会员等级分。

优酷VIP用户分布:

接近67%的用户为会员,也能理解。因为现在就算是会员用户,某些视频平台还是会给弄点广告、弹窗什么的,不是会员岂不是更肆无忌惮**了。

VIP7用户占0.39%,如果优酷会员等级规则未变的话,达到VIP7最低标准大概要连续包年超过20年以上才能到VIP7,膜拜有钱人。。。

VIP1是300积分以下,可以确定观看该剧的 5.81%的 VIP1 用户,是单纯为了看这个电视剧才开会员的。

考虑到该剧跨6、7、8三个月,应该有一部分用户选择包季VIP则刚好可达到VIP2。所以VIP2用户中一部分是为了追剧重新开通会员的老用户,一部分是开了包季的新用户。

VIP4 - VIP7占比达到了50%,VIP4至少是两年以上会员才能达到这个等级,优酷VIP用户黏度还是蛮高的。

追这部剧的人那么热情,而这部剧的33%的非会员 短期之内应该不会有开会员的欲望。VIP1是单纯为了这部剧开的一个月或者两个月会员,所以该剧一结束,用户留存可能性很低。

而VIP2和VIP3就是最需要挖掘的用户,优酷平台应该想办法引导这两个等级的用户继续开会员。

会员等级与用户等级关系:

大部分用户都等级低于20级,VIP级别低于2级。

在等级为100级的用户中大部分是非VIP用户,,,想让我充钱是不可能的。

VIP用户的普通等级也相对高一些,大家充钱开会员之后似乎愿意花更多时间在优酷平台上了。

用户名规律:

这种视频平台纯中文名应该会远高于其他昵称,事实上统计结果却并不符合预期。

以数字开头的用户非常少,很符合逻辑。

以数字结尾的人占了三成有余,而以字母数字作为开头或结尾的人数竟达到了一半,一般情况下只有用户名不可重复 以昵称作为账号的平台才会出现这种情况。

这应该是优酷与支付宝的深度合作造成的:直接在支付宝开联名会员、蚂蚁积分兑会员、优酷强推用支付宝冲会员,所以会很多人优先用支付宝登录优酷。

而优酷默认是直接拿淘宝昵称做用户名的,淘宝昵称又不可重复,大部分人会在昵称之后加上数字字母以避免重复。

证实支付宝为优酷带来了很多用户。

优酷用户名词云:

数字使用率最高、接着周围一圈字母、其次是汉字。

‘1’ 的使用率最高,频次达到了三万六千多,整体大家还是偏爱数字以避免昵称重复。

不知道你的昵称是否也包含了上面的高频汉字

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-10-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Crossin的编程教室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
爬取3万+评论,告诉你究竟是哪些人不喜欢《长安十二时辰》?
最近,悄悄上线的《长安十二时辰》在朋友圈被吹爆了:年度最佳古装剧、服道化精致、电影质感、良心剧等赞美的声音不绝于耳。该剧首播时在豆瓣拿到了8.8的高分,但是,随着剧情的深入,豆瓣的评分却慢慢降低到现在的8.6分,一部分人提出了不少的质疑,甚至有人说这是一部用战术上的勤奋(服道化)来掩盖战略上的懒惰(叙事和节奏)的剧。
CDA数据分析师
2019/07/16
6080
爬取3万+评论,告诉你究竟是哪些人不喜欢《长安十二时辰》?
浅析《长安十二时辰》里的望楼,人类在唐朝就有 5G 愿望了?
《古都24小时》哦不《长安十二时辰》,让很多人跟着易烊千玺和雷佳音,回了趟大唐!
区块链大本营
2019/07/19
5950
浅析《长安十二时辰》里的望楼,人类在唐朝就有 5G 愿望了?
论背景调查,《长安十二时辰》的大案牍术可比不上现在
最近文摘菌身边的小伙伴都在追一部剧,叫《长安十二时辰》,于是天性好奇而又充满探索精神的文摘菌就去看了一下。
大数据文摘
2019/07/18
5610
论背景调查,《长安十二时辰》的大案牍术可比不上现在
看《长安十二时辰》震惊了,难道唐朝就有大数据和云计算?
导读:这个夏天,笔者被一部国产剧给吸引住了,一口气连追了20多集,就是最近火爆全网、口碑炸裂的《长安十二时辰》。
IT阅读排行榜
2019/07/30
6830
《长安十二时辰》背后的文娱大脑:如何提升爆款的确定性?
大家好,我是来自优酷内容智能团队的资深技术专家牧己,主要负责基于大数据和人工智能去解决内容方面的问题。接下来,我将以《长安十二时辰》为例,分享优酷在提升“爆款确定性”中的技术实践。
LiveVideoStack
2019/08/16
8870
《长安十二时辰》背后的文娱大脑:如何提升爆款的确定性?
技术分析 | 谁是终极大Boss?一张图看懂《长安十二时辰 》人物关系
豆瓣评分高达8.6的国产剧《长安十二时辰》,终于在今晚迎来大结局——幕后BOSS究竟是谁?张小敬和李必命运如何,都一一揭开谜底。该剧改编自以“脑洞大”著称的作家马伯庸同名小说,悬疑反转的快节奏剧情,美轮美奂的长安城场景,唐朝韵味的妆法服装,刻画细致的人物角色,情节、灯光、道具、演技均比肩电影制作。
逸迅科技
2019/08/13
3.9K0
技术分析 | 谁是终极大Boss?一张图看懂《长安十二时辰 》人物关系
用Python分析《令人心动的offer2》的13万条弹幕,网友们都在吐槽什么?
综艺,是我们劳累了一天的放松方式,也是我们饭后的谈资。看着自己喜欢的综艺,时光足够美。而《令人心动的offer》,就是一个不错的综艺选择。
龙哥
2020/12/07
3390
用Python分析《令人心动的offer2》的13万条弹幕,网友们都在吐槽什么?
解密《长安十二时辰》之数据“黑科技”丨Informatica微电台
本期Informatica微电台邀请到了Informatica中国区销售总经理李晨为我们揭示《长安十二时辰》的“硬核黑科技”,解密“古代大数据中心”靖安司——
数据猿
2019/09/02
1.1K0
解密《长安十二时辰》之数据“黑科技”丨Informatica微电台
真“不厚道”爱奇艺,投屏都要割韭菜,网友:吃相真难看
金磊 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI “不合理”、“不厚道”、“更无权”。 这就是近日上海市消保委,在公开点名爱奇艺的发文中送上的“犀利三连”。 原因无他,正是因为爱奇艺App突然开始限制用户使用投屏功能—— 以前,黄金VIP会员支持最高4K清晰度投屏; 现在,黄金VIP会员只能支持480P清晰度投屏。 若想继续看4K?加钱再升级白金。 这可真应了那句“VIP、VVIP、VIP中P”…… 就连上海市消保委都评价说: 套娃式充会员薅消费者羊毛的做法要不得! 相关话题一出,也随即登上了微
量子位
2023/02/28
4680
真“不厚道”爱奇艺,投屏都要割韭菜,网友:吃相真难看
弹幕挖掘在综艺节目热点分析中的应用初探
作者:黄耀鹏, 腾讯PCG数据分析工程师 |导语 视频弹幕作为视频内容延伸、以及用户喜好反馈的一部分,有着巨大的挖掘价值。本文旨在通过运用文本挖掘技术,从弹幕中挖掘综艺节目热点话题,助力平台精准把握用户消费偏好、提升节目运营效率。 声明:本文运营方案相关的思考为个人观点,不代表腾讯视频既有运营方案和平台价值取向。本文仅纯粹作为个人感兴趣的技术研究总结。抛砖引玉,期待感兴趣的同学一起交流探讨。 1. 业务场景思考 1.1 视频弹幕的本质 弹幕文化,首先兴起于ACG社区等小众群体。而随着B站等弹幕视频网站的
腾讯大讲堂
2020/12/02
1.7K0
实战 | 用Python爬取《云南虫谷》3.6万条评论,并做数据统计可视化展示分析,好看!
最近鬼吹灯系列网剧《云南虫谷》上线,作为鬼吹灯系列作品,承接上部《龙岭迷窟》内容,且还是铁三角原班人马主演,网友直呼非常好看!
可以叫我才哥
2021/09/24
1.3K0
五个趣味案例教你数据分析的基本思想
今天和大家分享一下数据分析的一些基本思想,我给它起了个名字叫做用数据说话。 用数据说话,就是用真实的数据说真实的话!真实也可以理解为求真务实。那么,数据分析就是不断地求真,进而持续地务实的过程!用一句话表达就是用数据说话,用真实的数据说话,说真话、说实话、说管用的话。 1.数据 数据本不会说话,但是面对不同的人时,就会发出不同的声音。现在我们以《荒岛售鞋》这个老故事为引例,从数据分析的角度来解读,看看能不能开出新花?为防止大家案例疲劳,我尽量用新的表达方式把故事罗嗦一下! 话说郭靖和杨康,被成吉思汗派去美丽
机器学习AI算法工程
2018/03/09
1.7K0
五个趣味案例教你数据分析的基本思想
2016 年中国互联网内容产业全景数据解读
张钦坤 腾讯研究院秘书长、版权研究中心主任       田小军 腾讯研究院高级研究员、版权研究中心副秘书长  一、文娱消费新时代下互联网内容产业的爆发  (一)互联网内容产业展现的市场潜力与内容趋势 1. 市场规模 5000 亿+,经济新常态下互联网内容产业逆势爆发       经历了数十年的奇迹增长,中国经济正处三期叠加的新常态,增速较之数年前有所下降,但经济结构持续优化。根据国家统计局数据,2016 年上半年,按可比价格计算,我国国内生产总值同比增长 6.7%;总体来看,在供给侧结构性
腾讯研究院
2018/02/01
1.7K0
2016 年中国互联网内容产业全景数据解读
手把手教你用Python网络爬虫获取B站UP主10万条数据并用Pandas库进行趣味数据分析
大家好,我是Python进阶者!今天来给大家分享小小明的另一篇巨作,上一次分享了他开发的一个filetools,十分好用,这篇文章里边也会用到,没来得及上车的小伙伴,记得戳这里:盘点一个小小明大佬开发的Python库,4个超赞功能。言归正传,一起来看看今天的干货内容吧~
Python进阶者
2021/09/15
4.1K1
“我有故事,你要听吗?” | 18个案例全盘解析中国跨文化传播创新
“越是民族的,就越是世界的”,与全人类共享文化经验是美好的愿景,但本土文化出海从来不是一件容易的事。在“新全球化”背景下,中国的故事要怎么讲?我国的跨文化传播叙事取得了哪些长足发展与成果?肖珺、李朝霞原发布于单波主编《中国传播创新研究报告(2019)》的一篇文章,作者对过去一年中国跨文化传播创新实践作出最新研究,从实际案例出发,探索了促进多元文化共同发展的新理念。 核心发现 2018年的整体情况表明,中国各类传播主体正在自觉或不自觉地实践跨文化传播: 1、观念创新主要解决“为什么”的问题,在逆全球化的对抗
腾讯大讲堂
2019/11/22
1.6K0
“我有故事,你要听吗?” | 18个案例全盘解析中国跨文化传播创新
Python电影评论数据分析系统_echarts数据可视化
书接上文,继上文实现了《复仇者联盟4:终局之战》电影的影评数据分析采集之后,本文主要对获取到的影评数据进行一些可视化展示,主要的可视化展示手段是词云。
全栈程序员站长
2022/09/30
1.2K0
Python电影评论数据分析系统_echarts数据可视化
大数据公司挖掘数据价值的49个典型案例
本文力图从企业运营和管理的角度,梳理出发掘大数据价值的一般规律: 以数据驱动的决策,主要通过提高预测概率,来提高决策成功率; 以数据驱动的流程,主要是形成营销闭环战略,提高销售漏斗的转化率; 以数据驱动的产品,在产品设计阶段,强调个性化;在产品运营阶段,则强调迭代式创新。 从谷歌、亚马逊、Facebook、LinkedIn,到阿里、百度、腾讯,都因其拥有大量的用户注册和运营信息,成为天然的大数据公司。而像IBM、Oracle、EMC、惠普这类大型技术公司纷纷投身大数据,通过整合大数据的信息和应用,给其他公司
机器学习AI算法工程
2018/03/09
5K1
《增长黑客》节选与笔记[通俗易懂]
这本书涉及了很多具体又贴合现实的互联网产品问题,即使你是非专业人士,也应该读一读,了解开发者是如何把你当猫耍的,以便你更好地认识一些套路,解锁,为选择手机软件或者云端应用擦亮眼睛!
全栈程序员站长
2022/08/27
7.8K0
EXCEL利用VBA把汉字转拼音(李晓锋版)20180828更新「建议收藏」
代码更新20180607:根据评论,之前的代码的确是无法翻译“瑜 琦 钰 奕”这四个字的拼音,原因是他们的码值没有包含在代码中,现在已添加相应代码。谢谢 likewam 的评论。另外,希望大家能把自己使用过程中发现的所有不能转换的汉字都添加到评论,让我们一起来完善这部分代码。
全栈程序员站长
2022/06/24
2.8K0
盘点python工具包并优化pip下载加速
开源地址:https://github.com/wolfbolin/BiliUtil 安装命令:pip install BiliUtil
全栈程序员站长
2022/09/15
5.6K0
盘点python工具包并优化pip下载加速
推荐阅读
爬取3万+评论,告诉你究竟是哪些人不喜欢《长安十二时辰》?
6080
浅析《长安十二时辰》里的望楼,人类在唐朝就有 5G 愿望了?
5950
论背景调查,《长安十二时辰》的大案牍术可比不上现在
5610
看《长安十二时辰》震惊了,难道唐朝就有大数据和云计算?
6830
《长安十二时辰》背后的文娱大脑:如何提升爆款的确定性?
8870
技术分析 | 谁是终极大Boss?一张图看懂《长安十二时辰 》人物关系
3.9K0
用Python分析《令人心动的offer2》的13万条弹幕,网友们都在吐槽什么?
3390
解密《长安十二时辰》之数据“黑科技”丨Informatica微电台
1.1K0
真“不厚道”爱奇艺,投屏都要割韭菜,网友:吃相真难看
4680
弹幕挖掘在综艺节目热点分析中的应用初探
1.7K0
实战 | 用Python爬取《云南虫谷》3.6万条评论,并做数据统计可视化展示分析,好看!
1.3K0
五个趣味案例教你数据分析的基本思想
1.7K0
2016 年中国互联网内容产业全景数据解读
1.7K0
手把手教你用Python网络爬虫获取B站UP主10万条数据并用Pandas库进行趣味数据分析
4.1K1
“我有故事,你要听吗?” | 18个案例全盘解析中国跨文化传播创新
1.6K0
Python电影评论数据分析系统_echarts数据可视化
1.2K0
大数据公司挖掘数据价值的49个典型案例
5K1
《增长黑客》节选与笔记[通俗易懂]
7.8K0
EXCEL利用VBA把汉字转拼音(李晓锋版)20180828更新「建议收藏」
2.8K0
盘点python工具包并优化pip下载加速
5.6K0
相关推荐
爬取3万+评论,告诉你究竟是哪些人不喜欢《长安十二时辰》?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验