前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >谁才是权游的真正主角。

谁才是权游的真正主角。

作者头像
小F
发布于 2020-10-09 07:30:57
发布于 2020-10-09 07:30:57
37500
代码可运行
举报
运行总次数:0
代码可运行

上个礼拜权游大结局,最终的结果「布兰」登上了铁王座。

这个结果确实是大家没有想到的。

原本想着如果不是「龙妈」,那么就该是「雪诺」。

怎么就轮到「布兰」了呢。

一个可以随时随地监视别人的人坐上了铁王座,细思极恐...

权游从2011年4月17日开播直到最后一集5月19日,一共历时九年,终于落下了帷幕。

也算是陪伴了一些人的青春,看看上图里的「小布兰」和长大后的「布兰」。

时光荏苒,岁月如梭,有那么点点哈利波特的感觉(同样也是好多年)。

这次找到了一些权游的数据集,针对这些数据来做一些分析。

主要有人物信息,字幕信息以及屏幕时间信息。

这些数据由「GitHub」上的一位大佬整理的,具体可以点击阅读原文了解详情。

/ 01 / 杀手榜

数据是JSON文件,都是别人已经整理好的。

如下是人物信息,包含姓名,家族,人物图片,兄弟姐妹等。

这里只看谁干掉的人最多,其余大伙可以自行探索。

读取文件后,进行排序,代码如下。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import json

# 读取人物信息文件
with open("characters.json", 'r') as load_f:
    load_dict = json.load(load_f)
    characters = load_dict["characters"]

# 计算人物的杀人数
item = {}
for character in characters:
    if 'killed' in character.keys():
        item[character['characterName']] = len(character['killed'])

# 排序
top15 = sorted(item.items(), key=lambda x: x[1], reverse=True)[:15]
print(top15, '\n\n')

# 获取杀手榜前15,以及是哪位被领盒饭
for i in top15:
    for character in characters:
        if character['characterName'] == i[0]:
            print(i[1], i[0], character['killed'], '\n\n')

结果如下。

看一下前四位狠人,「龙妈」「猎狗」「雪诺」「二丫」。

「猎狗」大叔看似人狠话不多,但是他的内心还是很正义的。

其中「二丫」杀了「夜王」,这一点也没毛病。

就是「雪诺」杀「龙妈」就有点那个啥了,上一秒我们还是“朋友”,下一秒就GG了。

木有想到网上居然还有神预测...

/ 02 / 发言榜

下面这个数据是每集的台词,概况如下。

通过遍历字典信息,获取人物发言频次。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import json

# 读取人物信息文件
with open("script-bag-of-words.json", 'r', errors='ignore') as load_f:
    load_dict = json.load(load_f)

# 对人物人名进行统计
names = []
for i in load_dict:
    for j in i['text']:
        name = j['name']
        if name not in names:
            names.append(name)
# print(names)

# 获取人物说话次数
item = {}
for name in names:
    num = 0
    for i in load_dict:
        for j in i['text']:
            if j['name'] == name:
                num += 1
    item[name] = num

# 排序
top15 = sorted(item.items(), key=lambda x: x[1], reverse=True)[:15]
for i in top15:
    print(i[1], i[0])

结果如下。

「小恶魔」「雪诺」「龙妈」「瑟曦」「詹姆」排行前五。

「提利昂」曾经说过“大脑需要书才能变得敏锐,就像剑需要磨刀石一样。”

果然作为读书多的,话也就多了。

不然就只能一句句「俺也一样」了...

弑君者「詹姆」,「小恶魔」的哥哥。

虽然前期做了不少坏事,不过最后改邪归正,真的实力圈粉。

/ 03 / 出场时间

对场景出现时间进行分析,数据概况如下。

对数据进行处理,代码如下。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import json
from datetime import datetime

# 读取每集的出场信息
with open("episodes.json", 'r') as load_f:
    load_dict = json.load(load_f)
    episodes = load_dict["episodes"]

for episode in episodes:
    # 获取每集的片段信息
    for scene in episode["scenes"]:
        # 处理时间数据
        start = datetime.strptime(scene['sceneStart'], "%H:%M:%S")
        end = datetime.strptime(scene['sceneEnd'], "%H:%M:%S")
        # 国家
        with open('got_1.csv', 'a+') as f:
            f.write(scene['location'] + ',' + str((end - start).seconds) + ',' + str(episode["seasonNum"]) + ',' + str(episode["episodeNum"]) + '\n')
        # 城市
        if 'subLocation' in scene.keys():
            with open('got_2.csv', 'a+') as f:
                f.write(scene['subLocation'] + ',' + str((end - start).seconds) + ',' + str(episode["seasonNum"]) + ',' + str(episode["episodeNum"]) + '\n')
        # 人物
        for people in scene['characters']:
            with open('got_3.csv', 'a+') as f:
                f.write(people['name'] + ',' + str((end - start).seconds) + ',' + str(episode["seasonNum"]) + ',' + str(episode["episodeNum"]) + '\n')

最后得到三个文件,分别为国家、城市及人物的出现时间。

这里不对每一季进行分析,那样内容太多了,有兴趣的可以自己试试。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd
from pyecharts import Bar

# 读取数据
df = pd.read_csv('got_1.csv', header=None)
# df = pd.read_csv('got_2.csv', header=None)
# df = pd.read_csv('got_3.csv', header=None)

# 汇总名称
names = []
for name in df[0]:
    if name not in names:
        names.append(name)

item = {}
for name in names:
    nums = []
    for num in df[df[0] == name][1]:
        nums.append(num)
    # 列表求和
    s = sum(nums)
    # 时间转换
    m, s = divmod(s, 60)
    h, m = divmod(m, 60)
    item[name] = "%02d:%02d:%02d" % (h, m, s)

# 出场时间前15位角色
top15 = sorted(item.items(), key=lambda x: x[1], reverse=True)[:15]
for i in top15:
    print(i[1], i[0])

结果如下。

先看一下区域的时间分布。

第一王领,第二北境。

下面是城市的屏幕时间情况。

第一位「君临城」——七大王国的首都。

第二位「临冬城」——史塔克家族的城堡。

最后是人物出现的屏幕时间。

第一位是国王之手「小恶魔」。

第二位是什么都不懂的「雪诺」。

第三位是白手起家最后又被骗的「龙妈」。

对每季的人物进行统计。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 统计每季人物出场时间
for i in range(1, 9):
    name_1 = []
    nums_1 = []
    df1 = df[df[2] == i]
    for j in top15:
        num_1 = []
        for k in df1[df1[0] == j[0]][1]:
            num_1.append(k)
        name_1.append(j[0])
        nums_1.append(sum(num_1))
    print(i, name_1, nums_1)


def people_scenes():
    """
    每季人物出现时间
    """
    # 参数数据
    attr = ['提利昂', '雪诺', '龙妈', '三傻', '瑟曦', '二丫', '詹姆', '莫尔蒙', '戴佛斯', '山姆', '瓦里斯', '席恩', '布蕾妮', '布兰', '猎狗']
    v1 = [4903, 5323, 4900, 3608, 4252, 3655, 2523, 3650, 0, 1918, 2949, 3270, 0, 3115, 2442]
    v2 = [5257, 2658, 3037, 2455, 3021, 3373, 1363, 1694, 1879, 1225, 1594, 2908, 1869, 1387, 1445]
    v3 = [4146, 2620, 2760, 2369, 2429, 2612, 2674, 2561, 1636, 2074, 1533, 1605, 2009, 1768, 1283]
    v4 = [5480, 3818, 2490, 3130, 4694, 2510, 4269, 1634, 1021, 2273, 1332, 1190, 1536, 1427, 2328]
    v5 = [4469, 5066, 3767, 2919, 3927, 2770, 1889, 2998, 1452, 2742, 876, 1635, 1163, 0, 0]
    v6 = [2852, 5527, 2473, 3848, 2222, 2294, 2948, 827, 4101, 1268, 1424, 1626, 1749, 2107, 906]
    v7 = [5849, 7840, 5773, 3436, 3426, 2744, 4074, 4549, 4417, 1747, 3072, 2553, 2313, 1246, 3657]
    v8 = [8148, 7513, 6494, 3940, 1551, 4357, 3935, 1740, 3679, 2871, 3247, 888, 3817, 3296, 1827]
    # 创建条形图
    bar = Bar("权游人物出场时间分布", title_pos='center', title_top='18', width=800, height=400)
    bar.add("第一季", attr, v1, is_convert=True, xaxis_min=10, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=False, is_legend_show=True, label_pos='right', legend_orient='vertical', legend_pos='80%', legend_top='30%', is_yaxis_inverse=True, is_splitline_show=False, is_stack=True)
    bar.add("第二季", attr, v2, is_convert=True, xaxis_min=10, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=False, is_legend_show=True, label_pos='right', legend_orient='vertical', legend_pos='80%', legend_top='30%', is_yaxis_inverse=True, is_splitline_show=False, is_stack=True)
    bar.add("第三季", attr, v3, is_convert=True, xaxis_min=10, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=False, is_legend_show=True, label_pos='right', legend_orient='vertical', legend_pos='80%', legend_top='30%', is_yaxis_inverse=True, is_splitline_show=False, is_stack=True)
    bar.add("第四季", attr, v4, is_convert=True, xaxis_min=10, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=False, is_legend_show=True, label_pos='right', legend_orient='vertical', legend_pos='80%', legend_top='30%', is_yaxis_inverse=True, is_splitline_show=False, is_stack=True)
    bar.add("第五季", attr, v5, is_convert=True, xaxis_min=10, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=False, is_legend_show=True, label_pos='right', legend_orient='vertical', legend_pos='80%', legend_top='30%', is_yaxis_inverse=True, is_splitline_show=False, is_stack=True)
    bar.add("第六季", attr, v6, is_convert=True, xaxis_min=10, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=False, is_legend_show=True, label_pos='right', legend_orient='vertical', legend_pos='80%', legend_top='30%', is_yaxis_inverse=True, is_splitline_show=False, is_stack=True)
    bar.add("第七季", attr, v7, is_convert=True, xaxis_min=10, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=False, is_legend_show=True, label_pos='right', legend_orient='vertical', legend_pos='80%', legend_top='30%', is_yaxis_inverse=True, is_splitline_show=False, is_stack=True)
    bar.add("第八季", attr, v8, is_convert=True, xaxis_min=10, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=False, is_legend_show=True, label_pos='right', legend_orient='vertical', legend_pos='80%', legend_top='30%', is_yaxis_inverse=True, is_splitline_show=False, is_stack=True)
    # 生成图表
    bar.render("权游人物出场时间分布.html")


people_scenes()

得到结果如下。

最后来看一下第一季的数据。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def people_season(season, mes1, mes2):
    """
    每季统计
    """
    attr = mes1
    v1 = mes2
    bar = 'bar' + str(season)
    bar = Bar('第' + str(season) + '季人物出场时间分布', title_pos='center', title_top='18', width=800, height=400)
    bar.add("", attr, v1, is_convert=True, xaxis_min=10, yaxis_label_textsize=8, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
    bar.render('第' + str(season) + '季人物出场时间分布.html')


# 遍历每一季
for season in range(1, 9):
    df2 = df[df[2] == season]
    for i in df2[0]:
        if i not in names:
            names.append(i)
    item = {}
    # 对人物出现时间进行统计
    for j in names:
        num_3 = []
        for k in df2[df2[0] == j][1]:
            num_3.append(k)
        item[j] = sum(num_3)
    # 排序
    top15 = sorted(item.items(), key=lambda x: x[1], reverse=True)[:15]
    print(top15)
    name_2 = []
    num_2 = []
    # 对前15位进行数据汇总
    for p in top15:
        name_2.append(p[0])
        num_2.append(p[1])
    print(season, name_2, num_2)
    people_season(season, name_2, num_2)

结果如下。

有一半都领盒饭了,当然也有坚持到最后的。

坚持下来的,狼家的居多。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 法纳斯特 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
用数据分析大家最喜欢什么类型的抖音视频。
从一开始的打开App没广告,再到现在启动页面有广告,刷视频也有广告,还有商品橱窗的存在。
efonfighting
2019/08/02
1.9K0
用数据分析大家最喜欢什么类型的抖音视频。
python 实现Web版股票行情界面
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
多凡
2019/11/01
2.6K0
Python强大的pyecharts绘画优美图形<二>
支持保存做种格式 对象.render(path='snapshot.html') 对象.render(path='snapshot.png') 对象.render(path='snapshot.pdf') 举个栗子:
Python疯子
2018/09/06
3.7K0
Python强大的pyecharts绘画优美图形<二>
更高级的数据可视化,使用pyecharts制作精美图表
提到用python进行数据可视化,那么大多数人选择都是matplotlib,但是生成的图表不能进行交互操作,比如时间轴拖动、交互式图例等,那么本文将对pyecharts进行详细讲解。
刘早起
2020/04/22
1.9K0
更高级的数据可视化,使用pyecharts制作精美图表
万能的python-画图
pyecharts是一个用于生成Echarts图标的类库。实际就是Echarts与Python的对接。
py3study
2020/01/08
5380
美团数据分析 - 国庆上海去哪吃?
来源 | https://www.jianshu.com/u/7e54016a5a06
编程文青李狗蛋
2019/10/10
4670
美团数据分析 - 国庆上海去哪吃?
Python爬虫-selenium
对于Ajax加载的网页已经分析了好几回,这回来说说利用selenium自动化获取网页信息。
小F
2020/10/09
7930
Python爬虫-selenium
Scrapy框架之爬取拉勾网
最近有一段时间没爬虫了,现在来学习一下爬虫框架及数据库操作! 看完这篇文章,你可以学会如下操作!
菲宇
2019/06/13
6350
Scrapy框架之爬取拉勾网
『数据可视化』基于Python的数据可视化工具「建议收藏」
pyecharts 兼容 Python2 和 Python3。目前版本为 0.1.4
全栈程序员站长
2022/06/28
6350
『数据可视化』基于Python的数据可视化工具「建议收藏」
Python数据可视化:Python大佬有哪些?
之前讲了代理池以及Cookies的相关知识,这里针对搜狗搜索微信公众号文章的爬取,将它俩实践一下。
小F
2020/10/09
8020
Python数据可视化:Python大佬有哪些?
上映4天,票房7.4亿的《海王》,用Python分析数据看大片!
《海王》一部电影带你重温《驯龙高手》《变形金刚》《星球大战》《星河战队》《铁血战士》《安德的游戏》《异形》可能还借鉴了对手的《钢铁侠》与《黑豹》剧情,再稍稍带一点《大鱼海棠》的味道,配上一丢丢温子仁式恐怖片套路,优秀的商业片,应该是DC年度最佳了。温子仁,优秀的集大成者。 上映4天,票房7.4亿
周三不加班
2019/09/03
4780
上映4天,票房7.4亿的《海王》,用Python分析数据看大片!
人大代表数据分析爬取代表数据正则表达式提取需要的数据还可以把上面数据画成饼图民族词云图统计代表姓氏人数姓氏词云
爬取代表数据 import requests import re import time from lxml import html from selenium import webdriver r = requests.get(url='http://www.sohu.com/a/223885358_118392') # 最基本的GET请求 time.sleep(60) html = r.text 正则表达式提取需要的数据 content = re.findall(u'<p>([\u2E80-\u9
用户1733462
2018/06/07
9460
IT职场新人选python,go还是java?用数据来说话
最近有读者在后台问,刚参加工作,想选一个职业方法,问我现在python很火,但是貌似就业机会不是很多,所以比较纠结现在到底是学python,go还是java. 所以我就想我们能不能用数据说话,看看python,go,java这三种热门语言,到底在市场上什么行情。
南山烟雨
2019/05/15
6280
IT职场新人选python,go还是java?用数据来说话
揭开互联网公司的神秘面纱,数据解读那些slay整个行业的互联网公司
作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据
周萝卜
2019/07/17
6380
揭开互联网公司的神秘面纱,数据解读那些slay整个行业的互联网公司
Pyechart入门
pyecharts是一个用于生成echarts图表的类库。echarts是百度开源的一个数据可视化库,用echarts生成的图可视化效果非常棒。使用pyechart库可以在python中生成echarts数据图。 官网:http://pyecharts.org Github:https://github.com/pyecharts/pyecharts/ 在官网中可以获得比本文更详细的pyecharts库的使用方法。 下面代码的开发环境为jupyter notebook,使用在jupyter notebook中的截图表示运行结果。
潇洒坤
2018/09/10
2.6K0
Pyechart入门
Python爬取的微信好友信息里我看到了自律 | CSDN博文精选
接下来我会使用「itchat」(开源的微信个人接口)来获取一些公开的好友信息,使用itchat.get_friends(),我们可以获取微信好友头像、性别、省份、城市、年龄等具体信息。
AI科技大本营
2019/11/13
3930
数据解读
数据森麟公众号收到读者来稿,一篇关于《爱情公寓》电影版的数据分析,在此向张凡幸同学表示感谢。
数据森麟
2019/09/27
4080
数据解读
Python 6个维度,数万条数据帮你揭秘房租大涨
8月初,有网友在“水木论坛”发帖控诉长租公寓加价抢房引起关注。据说,一名业主打算出租自己位于天通苑的三居室,预期租金7500元/月,结果被二方中介互相抬价,硬生生抬到了10800。
龙哥
2018/10/22
7360
Python 6个维度,数万条数据帮你揭秘房租大涨
30分钟学会pyecharts数据可视化
小明:Echarts 是一个由百度开源的数据可视化javascript库,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts诞生了。简单地说,pyecharts就是百度开源的一个强大的javascript数据可视化库Echarts的python接口。
lyhue1991
2020/07/20
2.4K0
数据分析——pyecharts
导入类库 1 from pyecharts import Pie, Bar, Gauge, EffectScatter, WordCloud, Map, Grid, Line, Timeline 2 import random make_point:标注,类似于matplotlib的text is_stack:堆叠,将同一图表中的不同图像堆叠显示 is_label_show:显示每个数据的标注 is_datazoom_show:数据缩放显示 地图 1 value = [120, 11
py3study
2020/01/20
1.2K0
推荐阅读
相关推荐
用数据分析大家最喜欢什么类型的抖音视频。
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验