首页
学习
活动
专区
圈层
工具
发布
综合排序最热优先最新优先
时间不限
豆瓣电影数据分析
一个多月后回过头来看,这篇报告虽然写得有模有样,但和数据分析报告还是有挺大差别的,主要原因在于: a.只是针对豆瓣电影数据分析太过宽泛了,具体关键指标到底是哪些呢? ; 3.比起网上能搜到的其他豆瓣电影数据分析,它更为详细,可视化效果也不错; 概述 本篇报告旨在针对豆瓣电影1990-2020的电影数据进行分析,首先通过编写Python网络爬虫爬取了51375条电影数据 基本框架 1.电影数据的评分、时长分析 1.1 电影数据总体描述 1.2 时长分布 1.3 评分分布 1.4 评分与时长、评论人数的关系 2.电影数据的地区分析 2.1 3.3 中美两国各类型电影的均分变化 4.演员与导演分析 4.1 作品数量 4.2 导演与演员排名 5.电影票房分析 5.1 票房随着年度变化趋势 5.2 票房与评分、 电影票房分析 结合电影票房网(http://58921.com/)采集到的3353条票房数据,与豆瓣数据按照电影名称进行匹配,可以得到1995-2020年在中国大陆上映的电影信息,分别分析中国内地电影的数量
贺思聪
2022-05-13
4.8K2
标签:
移动电影售票系统案例分析
议题与其他 UC002:查询电影票 用例名: 查询电影票 用例编号 UC002 参与者 潜在会员,会员 用例描述 参与者根据电影的名称、导演、以及演员,检索出所需电影的详细信息和 系统按查询条件查询电影信息和价格信息 4. 系统显示查询到电影详细信息 5. 参与者选中某个电影 6. 系统显示该电影的详细信息 替代流程 3a. 商户请求发布电影信息 2. 系统显示发布电影信息界面 3. 商户输入电影信息 4. 系统检查输入的电影信息 5. 系统顺序图:引导从用例过渡到系统的功能 BCE模式顺序图: 鲁棒性分析方法( 边界对象 控制对象 实体对象 ) UC001:注册会员 ? UC002:查询手机 ? 面向对象 什么是面向对象的分析? 面向对象的分析(Object Oriented Analysis,OOA)强调的是在问题域内发现和描述对象(或概念)。
小爷毛毛_卓寿杰
2019-02-13
2.6K0
标签:
多模型电影短评情感分析
多模型电影短评情感分析 首先,从传统的特征提取方面对比了BOW、TF-IDF、N-Gram技术,并使用不同的机器学习算法构建了不同的子模型,然后又采用了Stacking模型融合技术对短评情感进行了进一步的探索 言归正传,下面一起来看看电影短评情感分析的结果吧! 者将从以下几个大方向构建电影短评情感分析模型: 基于Bag-Of-Words特征的文本分类模型 基于TF-IDF特征的文本分类模型 基于Stacking模型融合的情感分析 基于深度学习的短评情感分析 基于 数据集说明 data目录里面的数据,只有2万行, 本项目为电影短评情感分析项目,代码文件说明: code/preprocessing.py]: 预处理文件 code/stacking.py: stacking code/dl_sa.py: 基于深度学习的情感分析模型。
润森
2022-12-20
6890
标签:
TMDB电影数据分析报告
TMDB电影数据分析报告 前言 数据分析的基本流程: 提出问题 理解数据 数据清洗 构建模型 数据可视化 形成报告 一、提出问题 本次报告的主要任务是:根据历史电影数据,分析哪种电影收益能力更好 导入数据集后,通过对数据的查看,并结合要分析的问题,筛选出以下9个要重点分析的变量: |序号|变量名|说明 |------ |1|budget|电影预算(单位:美元) |2|genres|电影风格 |3 特征选择:在分析每一个小问题之前,都要通过特征提取,选择最适合分析的变量,即在分析每一个小问题时,都要先构造一个数据框,放入要分析的变量,而不是在原数据框中乱涂乱画。 ', fontsize=20) plt.show() 不同电影风格的受欢迎程度分析: #定义一个数据框,以电影类型为索引,以每种电影类型的受欢迎程度为值 df_gen_popu = pd.DataFrame = 15) plt.xticks(np.arange(11)) plt.grid(True) plt.show() 原创电影与改编电影对比分析: #原创电影与改编电影对比分析 original_novel
润森
2022-09-22
1.4K0
标签:
SparkSQL 电影评价数据分析
approximately 3,900 movies made by 6,040 MovieLens users who joined MovieLens in 2000. 2000年,100万条电影评价数据集 ,包括3900部电影和6040个用户。 ; else return false; } ) 总结 本文通过电影数据集分析代码
birdskyws
2018-09-12
1.2K0
标签:
Python 分析电影《南方车站的聚会》
《南方车站的聚会》由刁亦男执导,主要演员包括:胡歌、桂纶镁、廖凡、万茜等,该片于 2019 年 5 月 18 在戛纳电影节首映,2019 年 12 月 6 日在中国正式上映。 我们可以看到有 5 万多条影评,目前豆瓣对查看影评数据的限制是:未登录最多可以查看 200 条数据,登录用户最多可以查看 500 条数据,我们要做的是通过 Python 爬取豆瓣 500 条影评数据,然后进行数据分析 '人物', '没有', '不是', '一种', '个人' '如果', '之后', '出来', '开始', '就是', '电影 上面我们只使用了评论内容信息,还有时间和星级信息没有使用,最后我们可以用这两项数据分析下随着时间的变化影片星级的波动情况,以月为单位统计影片从首映(2019 年 5 月)到当前时间(2019 年 12月
Python小二
2020-08-18
9430
标签:
利用机器学习分析电影偏好,探究电影情感历程以优化剧本
他们的研究重点是电影的情感历程,调查这些是否属于不同的类别,以及它们是否与电影的成功有关。 研究人员使用了包含6174部电影的数据集进行训练,每部电影都有完整的剧本,收入数据,IMDb评级和其他相关信息。 他们使用自然语言处理(NLP)算法,分析电影脚本以确定情感历程,然后利用这些结果在收入与公众接受度方面探讨电影的情感历程与其成功之间的关系。 尽管这些电影的平均表现更好,但研究人员指出,“如果说电影业应该只制作《Man in a Hole》,那就过于简单了。精心挑选的制作预算与流派相结合,可以制作出经济上成功又能表现各种情绪弧线的电影。” “在未来,我们希望创建可靠的方法来分析所有媒体中的情绪弧线,包括纪录片等非小说类作品以及YouTube上的短片等视频。一旦我们对这个工具进行了优化,我们就可以将该公司的业务商业化。”
AiTechYun
2018-07-27
8640
标签:
Java豆瓣电影爬虫——使用Word2Vec分析电影短评数据
  在上篇实现了电影详情和短评数据的抓取。到目前为止,已经抓了2000多部电影电视以及20000多的短评数据。   数据本身没有规律和价值,需要通过分析提炼成知识才有意义。 抱着试试玩的想法,准备做一个有关情感分析方面的统计,看看这些评论里面的小伙伴都抱着什么态度来看待自己看过的电影,怀着何种心情写下的短评。    获取数据(这里是豆瓣电影短评数据)     2. 数据处理(将短评数据使用分词器分词,并以空格连接分词结果)     3. 载入训练模型,分析感兴趣的维度(比如,近义词分词,关联词分析)     Github: https://github.com/NLPchina/Word2VEC_java 获取数据   数据就用短评数据 ,2万多条,对应的大概是2000多部的电影,一部电影抓的短评数在10条左右。
JackieZheng
2018-01-16
1.9K0
标签:
【Python数据分析五十个小案例】电影评分分析:使用Pandas分析电影评分数据,探索评分的分布、热门电影、用户偏好
例如,分析评分分布可以帮助我们识别评分过低或过高的电影,探索评分高的电影类型,进而为推荐系统提供优化建议。本文将通过Pandas库分析电影评分数据,帮助大家探索以下问题:电影评分的分布是怎样的? 电影评分分布分析各评分区间的电影数量分析我们可以根据评分区间对电影进行分类,统计各个区间的电影数量。例如,评分为1-3、4-6、7-9和10分的电影各有多少部。 (df) * 100:.2f}%")热门电影分析根据评分数筛选热门电影热门电影通常有大量的评分,我们可以通过num_ratings(评分数)来筛选这些电影。 [['title', 'rating', 'num_ratings']])用户偏好分析用户评分偏好分析我们可以通过电影类型(genre)来分析用户的评分偏好。 结论通过对电影评分数据的分析,我们发现:大多数电影的评分集中在7-9分之间,少部分电影评分过高或过低。热门电影不仅需要大量的评分数,还要有较高的评分。
小馒头学Python
2024-11-29
1.2K0
标签:
豆瓣电影评分数据分析
在前面对接口测试的知识体系相对来说写了很多的文章,今晚就结合部分的知识体系,把获取到的知识体系,结合pyecharts来数据进行一个简单的分析。 实现的思路是访问豆瓣最新的电影,然后使用requests库对它进行请求,获取到服务端返回的数据后,依据获取的数据,分别取出电影的名称,电影的评分,然后形成可视化的东西,这样在可视化的界面中,就可以看到最近电影哪些是比较受欢迎的并且它的评分比较高 ,对我们出去看电影来说,也是一个刚需。 ,和电影相对应的评分,见实现的源码: #! movies)) titleRates=[] for rate in rates: titleRates.append(int(float(rate))) bar=Bar('豆瓣电影评分数据分析
无涯WuYa
2018-12-25
1.7K0
标签:
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档