首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

我敢打赌,你猜不到去年电影国内票房最高演员

项目最初想法,从互联网上公开信息中采集2018年在国内上映电影票房、评分、类型、演员等信息,然后做一些数据分析和可视化展示。...我们将所有电影评分和票房做成散点分布图,得到上述图片。此图动态可交互,这里我截几张有代表性(点击图片后可放大): ? 依次动作、喜剧、剧情、动画四类电影分布。...第一名:王成思 参演电影:《西虹市首富》25亿;《唐人街探案2》34亿;《李茶姑妈》6亿 这……啊,演…… ? 斯坦·李凭借各种客串,位列第3。...项目整体思路: 通过 中国票房网 获得2018年大陆上映电影和每部电影票房数据 根据已有的票房数据,通过豆瓣 api 和详细页面,获得每部电影导演,演员和豆瓣评分等详细数据 分别通过 猫眼、时光网 和...imdb,获取这三个网站电影评分数据 新建影人条目,利用豆瓣获得影人数据,对2018年每个演员年参演电影进行统计 根据已有数据作图,分析2018年电影票房排名、不同网站评分差异、电影票房-评分关系等

56620

Python实锤:谁是带资进组最厉害明星?

下面这个柱状图表示表示每个演员出演部数,和出演电影平均分。 在第一小梯队,黄渤荣获了一个局部最高分和一个最不劳模称号:电影平均评分6.28,参演电影仅为15部。...但是别看人家众多演员中出演数量最少,就觉得人家不勤劳不红了。 友情提示,这张图说明参演电影,可不是主演电影哦! 看见与黄渤明显相反劳模 + 低分林雪了吗?...当我们把参演电影,和主演电影演员两位)都找出来时候,瞬间就能get到林雪“中国香港配角之王”称号。...冰冰的人气,紧紧排在人气之万古天乐之后;在电影评分方面,也是艳压了同组大花杨幂同学。不得不尴尬地指出一下,杨幂同学喜提了一个局部最烂电影奖哦,评分垫底,拖了明星们后腿呀!...至于安吉拉大宝贝为什么没有出现在列表里呢,主要是因为我在数据处理上,根据电影评分网友人数来确定

52810
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分

    IMDb简介 互联网电影资料库(Internet Movie Database,简称IMDb)一个关于电影演员电影、电视节目、电视明星、电子游戏和电影制作在线数据库。...为了保护结果不受恶意投票影响,并且,只有“经常投票用户”投票被记入结果,保护公平性,成为该类用户条件保密。...此外,《教父》和《肖申克救赎》平均评分分别是9.11和9.10,另外三部拿过第一电影在平均评分上与二者有明显差距。...由此可见,平衡评分人数和得分,避免小众高分影片排这个计算方法出发点。可问题在于:调节整个榜单排序主要依赖于评分人数预设值。...它还收录了173.7万男演员,101.1万女演员个人资料,有多少人有昵称,最近八卦新闻多,哪些演员主页中同时收录了他/她说过经典的话,它采访视频甚至收入信息。

    31800

    豆瓣电影数据分析

    ; b.最低评分为2分,最高评分为9.8分,平均分为6.50分; c.最多评分数量2091401条,最少评分数量100条,平均每部电影评分人数1765371条; 表格 1 电影数据总体描述...5-8区间内; 分析图20(b)反映了,对于评价人数而言,评价人数多电影,票房未必高,说明网友中有很大一部分白嫖党; 分析图20(c)可知,对于时长而言,过长或过短电影一般都不能取得好票房,...图 22 执导电影总票房前30导演分布情况 图 23参与电影总票房前30演员分布情况 表格 5 执导电影总票房排名30导演 表格 6参演电影总票房排名30演员 5.5 影片票房排名...分钟,评分主要集中在6-8分,评分电影往往时间更长、评论人数更多。...此外,还列举了票房排名30导演与演员,发现高票房导演与演员作品数量多,评价往往较低。另外,列举了票房排名20电影,发现国产电影与好莱坞大片占据内地电影市场较大份额。

    3.3K30

    如何抓取猫眼电影Top100影片信息?

    01 进入正文 对于喜好电影同学来说,猫眼电影和豆瓣电影应该是比较熟悉电影评分平台。但是,如何通过Python抓取猫眼电影评分100信息呢? URL获取 我们还是先分析URL。...打开猫眼电影TOP100榜,可以看到如下页面: ? URL:http://maoyan.com/board/4。但是,这一页只有排名10电影,如何获取下页URL呢?...页面解析 下面看一下具体页面,在查看网页源码可以看到具体内容。以排名第一霸王别姬例,HTML码如下: ? 本文通过正则表达式来获取影片信息,所以先要生成正则表达式Pattern。...这里要注意,因为写入内容包括汉字,所以需要设置系统编码,设置UTF-8,如下代码三行所示: import sys reload(sys) sys.setdefaultencoding('utf...演员": ":费雯·丽,罗伯特·泰勒,露塞尔·沃特森", "评分": "9.2"} 完整代码 # coding:utf-8 import requests from flask import json

    49930

    分析11年21部漫威电影,一览导演、主演、口碑票房最佳......

    电影宇宙第三阶段结束篇复联4导演仍旧罗素兄弟,将继续保持第一位置。而滚导前段时间因为“不恰当”发言被迪士尼从银护3开除,不过最近又有小道消息传又被找回来了,如果消息真,那么滚导可能成为第二。...03 演员 说完导演,再看看演员。由于豆瓣给主演名单连一些配角也在里面,所以小编仅取4名作为电影主演。大家要不要猜一下主演电影数目和参演数目最多分别是? ?...现在妮妮在电影主演名单上绝对C位,永远演员第一位。 其次美队演员Chris(EC)和雷神演员Chris(锤哥),寡姐随后(寡姐要有个人电影了,开心)。...那么漫威口碑如何呢?这里以国外IMDb和豆瓣数据例。 ? 从评分人数上看,蓝色IMDb评分人数一直都比紫色豆瓣评分人数多,但近几年,豆瓣评分人数逐渐提高,和IMDb不相上下。那么评分呢?...蓝色IMDb评分最高复联3,最低无敌浩克。紫色豆瓣评分最高复联3,最低黑豹。而且黑豹国内外口碑差距最大电影。虽然黑豹在国内口碑差,但国外收获了大大小小各项提名,也得了不少奖。

    63780

    电影知识图谱问答(四)| 问句理解及答案推理

    问句理解 针对用户提问自然语言问句,首先需要理解其中深层次语义信息,即获取问句实体和目标属性信息。以问句“流浪地球导演?”...构建规则模型可利用Python Refo库进行构建,比如构建某某电影导演?模糊匹配规则,方法如下所示。...# 某电影图片/上映地区/语言/上映时间/时长/其他名称/介绍/评分/ 评价人数 # 某电影类型 # 某电影有哪些演员 # 某电影有哪些编剧 # 某电影有哪些导演 # 某电影详细信息 # 某人图片...# 某电影评分是否大于8 # 哪些喜剧电影评分小于4 # ......# 某人出演了多少部电影 # 某演员参演评分大于X电影有哪些 # 某演员出演过哪些类型电影 # 演员A和演员B合作出演了哪些电影 # ...

    3.4K22

    数据告诉你,其实中国电影票房最强锦鲤,不是吴京

    作者 | 赵鹿鸣 数据 | 诸岳锋 设计师 | 郭晓静 本文经授权转自公众号 网易数读 打开购票软件,我们决定看哪一部电影因素可以有很多:也许是影片类型、场次安排,还有可能豆瓣评分...这是因为观众对知名演员市场定位和选片原则都有一个大概判断,这些判断直接影响了电影市场表现,也就是票房。 那么,成百上千位中国演员里,主演电影通常伴随着优质市场表现?...反观中国香港老牌演员,如成龙、梁朝伟、古天乐、周润发等人,尽管尚位列累计票房榜二十,在不考虑通货膨胀情况下,已经被白百何、井柏然等新兴演员超过。...数读菌以多次(≥5次)主演电影筛选门槛,结果可见:沈腾位列第一,8部主演电影(如《西虹市首富》、《夏洛特烦恼》)几乎片片卖座,片均票房超13亿,名副其实票房锦鲤。...以刘德华为例,2000至2004年,在历年票房最高10部国产电影,也就是共计50部电影中,刘德华主演影片就占到了8部,远远高出其他演员

    40530

    大数据解析《速度与激情》——让你肾上腺素狂飙

    文|彭博社 《速度与激情》系列重磅影片已经累计录得近14小时总片长和40亿美元总票房 《速度与激情8》将以一种观众已经之疯狂、让片方赚得盆满钵满语言继续讲述故事 到目前为止,《速度与激情》(Fast...《速度与激情8》将以一种观众已经之疯狂、让片方赚得盆满钵满语言继续讲述故事:变速换挡、引擎咆哮、飞车追逐、关于汽车愤怒嘲讽,以及啜饮Corona啤酒。...《速度与激情7》该系列电影迄今为止最成功一部影片,其全球票房收入达到15亿美元,在影评聚合网站烂番茄(Rotten Tomatoes)上获得79%评分。 赛车镜头减少!...赛车文化曾经这个系列电影不可或缺一部分,其中关键情节点往往取决于率先冲过终点线。...在所有8电影中,《速度与激情》系列做到了维持演员阵容持续性,并确保粉丝注意到这点。随着续集数量增长,影片中拥抱镜头也越来越多。

    66240

    那些年,吴孟达出演过作品与合作过演员

    达叔作品类型分布 在达叔238部作品中有67部电视剧和171部电影,其中83版《射雕英雄传》里达叔出演丐帮净衣帮彭长老,彼时星爷宋兵乙。...达叔作品评分分布 达叔出演过电视剧评分基本都在6分左右及以上,达叔出演过电影则大部分集中在6-8分。 ? 达叔作品评分分布 达叔作品中评分五: ? 评分5作品 1.6....达叔作品评价数分布 除了电视剧普遍都是较低评价数之外,达叔高分电影评价数也都较多。 ? 达叔作品评价数分布 达叔作品中评价数五: ? 评价数5作品 2....和达叔合作过导演云图 2.2. 达叔合作过演员 达叔合作过演员则高达1,157位,其中星爷首屈一指,合作剧作高达30部+,其次黄一飞和张敏21部以及华仔18部。...与星爷合作30不戏除了01年《少年足球》之前,其余全部上个世纪作品,不过星爷作为演员在01年之后也只出演过三部电影而已; ?

    68730

    我用Python纪念了那些被烂片收割智商税!

    诚然,豆瓣评分会存在一些“文艺滤镜”,对文艺片比较宽容,对此我们认为,“豆瓣评分不一定是真的高,但是被豆瓣打了低分真的低”。此次选择影片范围2010年至今国产影片: ?...可以看到豆瓣用户对国产片还是比较严格,大多数电影都是在6分一下,8分以上电影可以说是“凤毛麟角”,因此后续对烂片标准也要相应放低,下面看一下各个将分数向下取整后统计数量: ?...2010年之后获得9分国产电影只有一部,可以说是非常不易,大家可以猜一下哪部电影,看看是不是你心中9分电影 下面大家揭开谜底: ?...令人意想不到,就连超级烂片TOP10都可以收割5000万以上票房,更是有四部票房过亿,在此提醒大家“观影有风险,选片需谨慎” 演员榜 一部烂片诞生想必也离不开“演员努力,下面就来分别看看所出演电影平均分最高和最低演员...评分演员就无须赘述了,都是经过了市场和观众挑战,但是目前还没有一位演员在主演影片数量超过5部之后,分数可以上7,诚然有一部分是因为豆瓣对国产严格要求,但另一方面也在敦促电影人不断进步 下面看一下评分排在倒数演员

    26520

    我用Python纪念了那些被烂片收割智商税!

    诚然,豆瓣评分会存在一些“文艺滤镜”,对文艺片比较宽容,对此我们认为,“豆瓣评分不一定是真的高,但是被豆瓣打了低分真的低”。此次选择影片范围2010年至今国产影片: ?...可以看到豆瓣用户对国产片还是比较严格,大多数电影都是在6分以下,8分以上电影可以说是“凤毛麟角”,因此后续对烂片标准也要相应放低,下面看一下各个将分数向下取整后统计数量: ?...2010年之后获得9分国产电影只有一部,可以说是非常不易,大家可以猜一下哪部电影,看看是不是你心中9分电影 下面大家揭开谜底: ?...令人意想不到,就连超级烂片TOP10都可以收割5000万以上票房,更是有四部票房过亿,在此提醒大家“观影有风险,选片需谨慎” 演员榜 一部烂片诞生想必也离不开“演员努力,下面就来分别看看所出演电影平均分最高和最低演员...评分演员就无须赘述了,都是经过了市场和观众挑战,但是目前还没有一位演员在主演影片数量超过5部之后,分数可以上7,诚然有一部分是因为豆瓣对国产严格要求,但另一方面也在敦促电影人不断进步 下面看一下评分排在倒数演员

    32020

    我用Python纪念了那些被烂片收割智商税!

    诚然,豆瓣评分会存在一些“文艺滤镜”,对文艺片比较宽容,对此我们认为,“豆瓣评分不一定是真的高,但是被豆瓣打了低分真的低”。此次选择影片范围2010年至今国产影片: ?...可以看到豆瓣用户对国产片还是比较严格,大多数电影都是在6分一下,8分以上电影可以说是“凤毛麟角”,因此后续对烂片标准也要相应放低,下面看一下各个将分数向下取整后统计数量: ?...2010年之后获得9分国产电影只有一部,可以说是非常不易,大家可以猜一下哪部电影,看看是不是你心中9分电影 下面大家揭开谜底: ?...令人意想不到,就连超级烂片TOP10都可以收割5000万以上票房,更是有四部票房过亿,在此提醒大家“观影有风险,选片需谨慎” 演员榜 一部烂片诞生想必也离不开“演员努力,下面就来分别看看所出演电影平均分最高和最低演员...评分演员就无须赘述了,都是经过了市场和观众挑战,但是目前还没有一位演员在主演影片数量超过5部之后,分数可以上7,诚然有一部分是因为豆瓣对国产严格要求,但另一方面也在敦促电影人不断进步 下面看一下评分排在倒数演员

    36520

    用数据告诉你,哪位导演漫威影片中票房收割机?

    3 月 8国际劳动妇女节,漫威在这天“搞事”了。上映《惊奇队长》,这部漫威电影宇宙第一部女性超级英雄电影,也算是给妇女节献礼。身为漫威粉丝我,当时不会错过这部电影,趁着周末去观影。...漫威转型后第一部电影《钢铁侠》,虽然主演三线污点演员唐尼,不到 2 亿美金制作成本,但确在全球狂揽 5.8 亿票房。这也漫威 10 年计划打个响炮。...NO.3 数据分析 究竟才是票房收割机,当然需要一个评定标准。考虑到有些导演会指导多部电影,如下图所示。其中排行榜首罗素兄弟(乔·罗素与安东尼·罗素合称)一共指导三部电影。 ?...真的难以抉择,不得不说。这几位导演乔斯·惠登、瑞恩·库格勒、罗素兄弟,都是拍摄电影好手,能指导出成功商业片。 如果硬要要评选出最强票房收割期,那我只能算是电影评分。...我根据豆瓣上各部电影评分,计算出各位导演拍摄电影平均得分,最后生成柱形图。 ? 拍摄影片口碑排行前三名詹姆斯·古恩、罗素兄弟、乔恩·法夫罗。

    49930

    多种方法爬取猫眼电影并分析(附代码)

    比较懒,不想一页页地去翻100部电影介绍,想在一个页面内进行总体浏览(比如在excel表格中); ? 想深入了解一些比较有意思信息,比如:哪部电影评分最高?哪位演员作品数量最多?...爬虫目标 从网页中提取出top100电影电影名称、封面图片、排名、评分演员、上映国家/地区、评分等信息,并保存为csv文本文件。 根据爬取结果,进行简单可视化分析。...,按照评分评分人数从高到低综合排序取100名,每天上午10点更新。...下面根据excel数据结果,进行简单数据可视化分析,并用图表呈现。 4.1. 电影评分最高top10 首先,想看一看评分最高10部电影哪些?...那会儿应该还是黑白电影时代吧,看来电影口碑好坏跟外在技术没有绝对关系,质量才是王道。 4.3.1. 拥有电影作品数量最多演员 最后,看看100部电影中哪些演员作品数量最多。

    6.1K31

    豆瓣电影短评:Scrapy 爬虫+数据清理分析+构建中文文本情感分析模型

    用facebook-fasttext无监督学习 用cnn做中文文本分类 用rnn做中文文本分类 用gru来完成中文文本分类 总评分最高10部电影 最受欢迎电影类别排名 最受欢迎电影出品国家排名...最受欢迎电影导演排名 最受欢迎电影演员排名 最受欢迎电影语言排名 根据电影时长电影排名 根据电影投票数电影排名 根据电影评价数电影排名 根据电影提问数电影排名 根据电影发布时间规律 1...总评分?)/电影类别(按出现频次)/导演(按出现频次)/演员(按出现频次)/语言(按出现频次,可以对其根据**分类?)...从电影简介中分析情感关键词,看其与电影类别的关联、与导演性格关联、与演员关联。...所有短评统计分析:对每个电影爬取短评量大致分布均匀;取10电影,分别观察,短评喜欢和不喜欢label构建模型。

    1.5K30

    电影知识图谱问答(一)|爬取豆瓣电影与书籍详细信息

    两天时间内共爬取20W+条数据,包括电影信息、电影演员信息、书籍信息、书籍作者信息,GitHub链接https://github.com/weizhixiaoyi/DouBan-Spider。...电影演员信息包括演员id、姓名、图片链接、性别、星座、出生日期、出生地、职业、更多中文名、更多外文名、家庭成员、简介,共89592条数据信息。这里所指演员包括电影演员、编剧、导演。...总结一下,获取电影信息和电影演员信息流程 获取https://movie.douban.com/tag/#/界面所有电影类别genres,循环电影类别genres。...获取电影演员id,存到到redis已爬取队列之中,返回去重后演员id list。 多线程爬取演员id list之中电影信息。 start加20循环2-7步骤。...爬取过程中为了省事,我用收费ip代理池,蘑菇代理,每三分钟请求10个ip。如果你要使用的话,可以找一些免费ip代理工具,成功之后,将有效ip写入到iplist之中即可。

    1.7K31

    产品经理思路打造爆款电影:《网络迷踪》

    虽然全部镜头非实拍,但叙事还是很流畅 整部电影,就像是一个巧妙设计、适时推出优质产品,恰好也在最近占据了「Movie Store」几位。...而在豆瓣上,它评分高达 8.5,好于 96% 悬疑片,截至目前,这部电影全球票房已经达到了 8000 万美元。...用百万预算撑起千万票房导演谷歌员工 最了不起,这部电影仅仅用了 13 天进行拍摄,花了不到 100 万美元制作预算,所以目前票房成绩对这部小成本电影来说,无疑是名利双收。...拍电影之前,用产品思路做了个 Demo 起初,《网络谜踪》只是一个 8 分钟构想,但在投资人鼓励支持,以及编剧头脑风暴之下,它最终扩展成了一部电影长片,为了专心拍摄这部影片,阿尼什果断辞去了谷歌工作...同样,这部电影背后站着导演编剧团队,电影提供了优秀脚本和逻辑支撑,但呈现影片主演们对角色深入理解和投入演出。

    94910

    推荐算法三视角

    阿里著名协同过滤推荐算法swing,寻找图中更加稳固形状,共同评分过两个物品用户集合中,每两个用户和这个两个物品形成了一个四边形(下图红边一个swing结构),统计有多少个这样结构,每一个结构权重不同...LINE算法考虑顶点二阶相似,两个顶点有边一阶相似,两个顶点有共同邻居顶点二阶相似,它虽不做随机游走,但可以看作广度优先采样。...然后按照采样反方向做向传播,这就是一个k层图网络,下图一个k2例子。 ? 在用户和物品二部图基础上,增加物品属性作为顶点,建立新边,就得到了一个异质信息网络。...比如一个电影推荐系统,除了用户和电影外,还有导演,演员电影类型,导演拍摄电影电影属于某种类型,演员出演电影,导演与演员合作,诸如此类就能建立很多边。...其中一类推荐算法叫做meta-path,通过专家经验人工挑选出一些图中路径,如用户->演员->电影,用户->导演->电影,这样路径称之为meta-path,计算每一条meta-path权重,将用户和物品间所有

    1.2K20
    领券