我就在这里,不离不弃
——A·May
Re-1 |T-136
这一个星期,我在干什么?
小伙伴问:请问A·May,一个星期不发文,你死到哪里去了?
A·May回答:我死在了写报告的路上!
上述对话并不好笑,这可能是一个研究僧大概都要经历的过程,那就是每节课都需要做一个报告作业,几门课做报告的时间可能都挤在一起话,那就人间悲剧了。
本次报告关于科学研究方法,我将报告的PPT的内容分享给大家,感谢小组成员的努力,A·May在此表示诚挚的谢意。这篇报告只是我要分享的其中一篇,过几天后,我还会继续分享,以后相关内容也都会考虑做成PPT的格式分享给大家。如果有需要原稿的文件,请留言,最好能转发一下哦!
为什么称这次的报告为原版呢?
原因一,这次报告的内容做一次作业是足够了,但是这次报告中的数据,我虽然是用R整理出来的,可图形我是用Excel做出来了,并没有使用ggplot2加以实践(身为ggplot2的死粉,我感到很XX)。一方面是时间太紧张,Excel的图可以直接拿来用,不需要主题修改,便于使用;另一方面是关于ggplot2,我实践经验不足,在做了几个柱状图感觉并不满意,需要思路的调整。
原因二,本次报告中只针对了单个变量做了描述性的分析,而缺乏对于变量之间的关系研究,虽然主要变量都是分类变量,但是分类变量之间也是可以做相关性的探索与检验的,无论是否与主题有关,但无疑是用来检验扎实学习的好途径,对此可以拓展重新学习一下推断统计和检验的相关原理和操作。
原因三,在数据处理的过程中,有关于文本的处理,我是用Excel来完成的,这时候我有一个问题?就是Excel中的“查找/替换”功能,在R中究竟是怎么实现的呢?也许你会说是用[ ]符号和数据索引来完成,但是这也只是对数据的查找,而且并非是依据数据值的内容进行查找!在此时,我突发找到了stringr包与正则表达式在R中的重要地位,stringr具有查找和替换的功能,正则表达式为stringr提供依据的条件。所以,有必要深入学习并实践这两个方面,提升自己用R语言灵活处理数据的水平。
上述三个方面,就是本次报告之后新的扩展方向。同时,有关于科学研究方法的研究主题也是很不赖的,推荐给大家。之后的继续修改中,我会不断的公布一些数据和R脚本,也希望大家多多提出意见,谢谢。
报告的原文
参考阅读
学习数据挖掘交流平台
领取专属 10元无门槛券
私享最新 技术干货