如果我有讲解不清楚的,各位可以去翻翻相应的书籍,尽量弄懂这些知识,对于以后的数据分析有很大的帮助,因为许多模型都是需要这些基础知识的,几乎是到处要用.废话不多说,我首先来简单说明其数学含义,然后再用R来实现一次...中位数 median 就是将数据按从小到大的顺序排列起来,最中间的那个数,它3同均值一样反映了数据的水平,它的好处就是 不受极端值得影响,我们常常在箱线图中用到它
方差var 通俗的讲就是把数据的每一点与均值的距离的平方加起来再求均值...,反映了整个数据离散的状况,这里用到平方 纯粹是避免正负抵消的,所以我们完全可以理解为,所有点与均值点的误差的平均情况.若把均值点当作是某一 正确值,那么其他的点就是对正确值的模拟...4.矩阵计算
相乘:分为两种相乘 ,一种是点积,数量积,其乘法法则是将两个向量的对应的数相乘后求和.如a(1,2,3,4) 与b(1,2,3,4) 那么点积就是1*1+2*2+3*3+4*4=30,记住点积得到的结果是一个数....另外一种是乘积,它有一个法则,就是前面的矩阵(包括向量,向量就是矩阵的一种)的列数要与后面矩阵的行数相同,才能相乘.如A是3行4列的,B是4行5列的这样就能相乘,而且只能是AB乘不能是BA乘,也就是说外积不能交换顺序