腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
视频
用户
沙龙
专栏
专区
综合排序
丨
最热优先
丨
最新优先
时间不限
豆瓣
电影
数据
分析
一个多月后回过头来看,这篇报告虽然写得有模有样,但和数据
分析
报告还是有挺大差别的,主要原因在于: a.只是针对豆瓣
电影
数据
分析
太过宽泛了,具体关键指标到底是哪些呢? ; 3.比起网上能搜到的其他豆瓣
电影
数据
分析
,它更为详细,可视化效果也不错; 概述 本篇报告旨在针对豆瓣
电影
1990-2020的
电影
数据进行
分析
,首先通过编写Python网络爬虫爬取了51375条
电影
数据 基本框架 1.
电影
数据的评分、时长
分析
1.1
电影
数据总体描述 1.2 时长分布 1.3 评分分布 1.4 评分与时长、评论人数的关系 2.
电影
数据的地区
分析
2.1 3.3 中美两国各类型
电影
的均分变化 4.演员与导演
分析
4.1 作品数量 4.2 导演与演员排名 5.
电影
票房
分析
5.1 票房随着年度变化趋势 5.2 票房与评分、
电影
票房
分析
结合
电影
票房网(http://58921.com/)采集到的3353条票房数据,与豆瓣数据按照
电影
名称进行匹配,可以得到1995-2020年在中国大陆上映的
电影
信息,分别
分析
中国内地
电影
的数量
贺思聪
2022-05-13
4.8K
2
标签:
数据分析
移动
电影
售票系统案例
分析
议题与其他 UC002:查询
电影
票 用例名: 查询
电影
票 用例编号 UC002 参与者 潜在会员,会员 用例描述 参与者根据
电影
的名称、导演、以及演员,检索出所需
电影
的详细信息和 系统按查询条件查询
电影
信息和价格信息 4. 系统显示查询到
电影
详细信息 5. 参与者选中某个
电影
6. 系统显示该
电影
的详细信息 替代流程 3a. 商户请求发布
电影
信息 2. 系统显示发布
电影
信息界面 3. 商户输入
电影
信息 4. 系统检查输入的
电影
信息 5. 系统顺序图:引导从用例过渡到系统的功能 BCE模式顺序图: 鲁棒性
分析
方法( 边界对象 控制对象 实体对象 ) UC001:注册会员 ? UC002:查询手机 ? 面向对象 什么是面向对象的
分析
? 面向对象的
分析
(Object Oriented Analysis,OOA)强调的是在问题域内发现和描述对象(或概念)。
小爷毛毛_卓寿杰
2019-02-13
2.6K
0
标签:
uml
多模型
电影
短评情感
分析
多模型
电影
短评情感
分析
首先,从传统的特征提取方面对比了BOW、TF-IDF、N-Gram技术,并使用不同的机器学习算法构建了不同的子模型,然后又采用了Stacking模型融合技术对短评情感进行了进一步的探索 言归正传,下面一起来看看
电影
短评情感
分析
的结果吧! 者将从以下几个大方向构建
电影
短评情感
分析
模型: 基于Bag-Of-Words特征的文本分类模型 基于TF-IDF特征的文本分类模型 基于Stacking模型融合的情感
分析
基于深度学习的短评情感
分析
基于 数据集说明 data目录里面的数据,只有2万行, 本项目为
电影
短评情感
分析
项目,代码文件说明: code/preprocessing.py]: 预处理文件 code/stacking.py: stacking code/dl_sa.py: 基于深度学习的情感
分析
模型。
润森
2022-12-20
689
0
标签:
编程算法
python
机器学习
深度学习
神经网络
TMDB
电影
数据
分析
报告
TMDB
电影
数据
分析
报告 前言 数据
分析
的基本流程: 提出问题 理解数据 数据清洗 构建模型 数据可视化 形成报告 一、提出问题 本次报告的主要任务是:根据历史
电影
数据,
分析
哪种
电影
收益能力更好 导入数据集后,通过对数据的查看,并结合要
分析
的问题,筛选出以下9个要重点
分析
的变量: |序号|变量名|说明 |------ |1|budget|
电影
预算(单位:美元) |2|genres|
电影
风格 |3 特征选择:在
分析
每一个小问题之前,都要通过特征提取,选择最适合
分析
的变量,即在
分析
每一个小问题时,都要先构造一个数据框,放入要
分析
的变量,而不是在原数据框中乱涂乱画。 ', fontsize=20) plt.show() 不同
电影
风格的受欢迎程度
分析
: #定义一个数据框,以
电影
类型为索引,以每种
电影
类型的受欢迎程度为值 df_gen_popu = pd.DataFrame = 15) plt.xticks(np.arange(11)) plt.grid(True) plt.show() 原创
电影
与改编
电影
对比
分析
: #原创
电影
与改编
电影
对比
分析
original_novel
润森
2022-09-22
1.4K
0
标签:
编程算法
json
数据分析
数据可视化
SparkSQL
电影
评价数据
分析
approximately 3,900 movies made by 6,040 MovieLens users who joined MovieLens in 2000. 2000年,100万条
电影
评价数据集 ,包括3900部
电影
和6040个用户。 ; else return false; } ) 总结 本文通过
电影
数据集
分析
代码
birdskyws
2018-09-12
1.2K
0
标签:
spark
sql
数据分析
mapreduce
java
Python
分析
电影
《南方车站的聚会》
《南方车站的聚会》由刁亦男执导,主要演员包括:胡歌、桂纶镁、廖凡、万茜等,该片于 2019 年 5 月 18 在戛纳
电影
节首映,2019 年 12 月 6 日在中国正式上映。 我们可以看到有 5 万多条影评,目前豆瓣对查看影评数据的限制是:未登录最多可以查看 200 条数据,登录用户最多可以查看 500 条数据,我们要做的是通过 Python 爬取豆瓣 500 条影评数据,然后进行数据
分析
'人物', '没有', '不是', '一种', '个人' '如果', '之后', '出来', '开始', '就是', '
电影
上面我们只使用了评论内容信息,还有时间和星级信息没有使用,最后我们可以用这两项数据
分析
下随着时间的变化影片星级的波动情况,以月为单位统计影片从首映(2019 年 5 月)到当前时间(2019 年 12月
Python小二
2020-08-18
943
0
标签:
php
https
网络安全
腾讯云图数据可视化
http
利用机器学习
分析
电影
偏好,探究
电影
情感历程以优化剧本
他们的研究重点是
电影
的情感历程,调查这些是否属于不同的类别,以及它们是否与
电影
的成功有关。 研究人员使用了包含6174部
电影
的数据集进行训练,每部
电影
都有完整的剧本,收入数据,IMDb评级和其他相关信息。 他们使用自然语言处理(NLP)算法,
分析
电影
脚本以确定情感历程,然后利用这些结果在收入与公众接受度方面探讨
电影
的情感历程与其成功之间的关系。 尽管这些
电影
的平均表现更好,但研究人员指出,“如果说
电影
业应该只制作《Man in a Hole》,那就过于简单了。精心挑选的制作预算与流派相结合,可以制作出经济上成功又能表现各种情绪弧线的
电影
。” “在未来,我们希望创建可靠的方法来
分析
所有媒体中的情绪弧线,包括纪录片等非小说类作品以及YouTube上的短片等视频。一旦我们对这个工具进行了优化,我们就可以将该公司的业务商业化。”
AiTechYun
2018-07-27
864
0
标签:
其他
Java豆瓣
电影
爬虫——使用Word2Vec
分析
电影
短评数据
在上篇实现了
电影
详情和短评数据的抓取。到目前为止,已经抓了2000多部
电影
电视以及20000多的短评数据。 数据本身没有规律和价值,需要通过
分析
提炼成知识才有意义。 抱着试试玩的想法,准备做一个有关情感
分析
方面的统计,看看这些评论里面的小伙伴都抱着什么态度来看待自己看过的
电影
,怀着何种心情写下的短评。 获取数据(这里是豆瓣
电影
短评数据) 2. 数据处理(将短评数据使用分词器分词,并以空格连接分词结果) 3. 载入训练模型,
分析
感兴趣的维度(比如,近义词分词,关联词
分析
) Github: https://github.com/NLPchina/Word2VEC_java 获取数据 数据就用短评数据 ,2万多条,对应的大概是2000多部的
电影
,一部
电影
抓的短评数在10条左右。
JackieZheng
2018-01-16
1.9K
0
标签:
爬虫
java
【Python数据
分析
五十个小案例】
电影
评分
分析
:使用Pandas
分析
电影
评分数据,探索评分的分布、热门
电影
、用户偏好
例如,
分析
评分分布可以帮助我们识别评分过低或过高的
电影
,探索评分高的
电影
类型,进而为推荐系统提供优化建议。本文将通过Pandas库
分析
电影
评分数据,帮助大家探索以下问题:
电影
评分的分布是怎样的?
电影
评分分布
分析
各评分区间的
电影
数量
分析
我们可以根据评分区间对
电影
进行分类,统计各个区间的
电影
数量。例如,评分为1-3、4-6、7-9和10分的
电影
各有多少部。 (df) * 100:.2f}%")热门
电影
分析
根据评分数筛选热门
电影
热门
电影
通常有大量的评分,我们可以通过num_ratings(评分数)来筛选这些
电影
。 [['title', 'rating', 'num_ratings']])用户偏好
分析
用户评分偏好
分析
我们可以通过
电影
类型(genre)来
分析
用户的评分偏好。 结论通过对
电影
评分数据的
分析
,我们发现:大多数
电影
的评分集中在7-9分之间,少部分
电影
评分过高或过低。热门
电影
不仅需要大量的评分数,还要有较高的评分。
小馒头学Python
2024-11-29
1.2K
0
标签:
腾讯技术创作特训营S10
豆瓣
电影
评分数据
分析
在前面对接口测试的知识体系相对来说写了很多的文章,今晚就结合部分的知识体系,把获取到的知识体系,结合pyecharts来数据进行一个简单的
分析
。 实现的思路是访问豆瓣最新的
电影
,然后使用requests库对它进行请求,获取到服务端返回的数据后,依据获取的数据,分别取出
电影
的名称,
电影
的评分,然后形成可视化的东西,这样在可视化的界面中,就可以看到最近
电影
哪些是比较受欢迎的并且它的评分比较高 ,对我们出去看
电影
来说,也是一个刚需。 ,和
电影
相对应的评分,见实现的源码: #! movies)) titleRates=[] for rate in rates: titleRates.append(int(float(rate))) bar=Bar('豆瓣
电影
评分数据
分析
无涯WuYa
2018-12-25
1.7K
0
标签:
数据分析
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档