冰与火之歌:新的发现–自然语言与机器学习方法深度挖掘《冰火》文本
研究方向:
冰与火之歌这本风靡全球的影视/小说巨作,估计很多同学都看过,而且很喜欢吧?小智慧也是冰火的粉丝一枚,那么我们能否能用自然语言和机器学习的方法,从冰与火之歌的小说文本里验证读者的一些猜想,或是挖掘一些新的发现呢?
例如,每个主人公到底有多少外号?每个家族之间、人物之间的关系是怎样的,随时间是如何发展的?书中的每个章节都是从不同的人物视角展开,那么作者写作时有没有刻意用不同的风格和文笔写不同的人物?
书中真的暗示了R+L=J这个猜想吗?这些有趣的问题除了进行大量深度的阅读,还可以借助数学模型来帮助我们在大量文本中寻找答案。本项目旨在借助分析冰与火之歌的文本的趣味应用,来了解机器学习和自然语言处理的思路和方法。
项目收获:练习并掌握数据科学的各个流程,包括使用自然语言处理的方法预处理和整理大量文字数据,用机器学习的方法搭建模型,数据可视化结果。同时掌握科研的基本流程与方法。
项目目标:
1.处理百万级文字的数据,并用可视化方法对数据有直观了解
2.学会使用自然语言处理(stanford corenlp, spacy等软件)和机器学习(knn, neuralnetwork, decision tree等)来搭建模型解决问题
3.学会用合适的数据可视化方法来展示研究成果
适合学生:对冰与火之歌感兴趣,有一定或少量的python编程经验/基础知识
对学生的要求:
1.态度认真,良好的时间规划管理概念,每周能按时完成导师布置的作业。
2.python编程能力/基础知识。
3.上过微积分,线性代数,概率论三门课程,并良好的掌握。
项目时间:2-3个月。
项目方式:远程,skypemeeting。
项目名额:1-2个名额。
报名方式:
请直接联系微信发布的老师咨询,或者给公众号留言即可。
没有简历和成绩单无法受理申请,敬请谅解!
领取专属 10元无门槛券
私享最新 技术干货