是一个方差,它的每个特征都是方差.其中
.元素
表示每个特征的方差.我们已经对数据完成了零均值化,现在只需要将所有数据都除以向量
经过方差的归一化,数据分布变为:
?...但是特征值在不同的取值范围内,例如 x1 取值范围从 1 到 1000,特征 x2 的取值范围从 0 到 1,结果是参数 w1 和 w2 值的范围或者比率完全不同,这些数据轴应该是 w1 和 w2,为了直观理解...这只是一个二维特征的例子,实际上 w 是一个高维向量,因此用二维绘制 w 并不能正确的传达直观理解,但总的直观理解是代价函数会更圆一些,,前提是特征都在相似范围内,而不是从 1 到 1000,0 到 1...的差别很大的范围内,而是都在-1 到 1 的范围内,或者相似偏差,这使得优化代价函数变的更简单更快捷....实际上,如果特征 x1 范围在 0~1 之间,x2 在-1~1 之间,x3 在 1~2 之间,它们是相似范围,所以会表现的很好,如果在不同的取值范围内,如其中一个从 1 到 1000,另一个从 0 到