2017-2018学年中国人民大学信息资源管理学院秋季学期数据挖掘小组报告之一,歌词大侦探,于上周12月28日进行课堂展示与交流。作者包括:朱志伟、林雯、苟铭雪、郑媛月。主题与朋友圈刷屏的某音乐APP高度契合,同时富有更多意义。
课程小组报告分析内容包括:歌词数据的准备、歌词文本数据爬取、歌词文本数据的清洗,三位歌手(李健、周杰伦、邓紫棋)的歌词用词频率分析及可视化,三位歌手歌词中名词、动词与形容词的统计分析,三位歌手歌词中反映的天气特征分析、季节(春夏秋冬)分析,歌词中时间常用词分析,歌词中出现的地点分析,歌词中常用成语分析,歌词主题聚类及可视化。
整篇报告立意新颖、图文并茂、充满创意,对三位歌手的创作习惯进行了深度剖析和靓丽的可视化。
经征得四位学生的同意,将课程报告一部分内容的PPT摘录如下,请各位欣赏,并提出宝贵意见。
说明:该报告为课程小组项目报告,内容版权归学生和本课程《数据挖掘》(中国人民大学信息资源管理学院大三必修课)所有。未经作者和课程授课教师闫慧老师许可,不得引用、转载及任何商业性用途。
领取专属 10元无门槛券
私享最新 技术干货