归一化输入需要两个步骤
第一步-零均值化
subtract out or to zero out the mean 计算出 u 即 x(i)的均值
u 是一个向量,
每个训练数据
都是...但是特征值在不同的取值范围内,例如 x1 取值范围从 1 到 1000,特征 x2 的取值范围从 0 到 1,结果是参数 w1 和 w2 值的范围或者比率完全不同,这些数据轴应该是 w1 和 w2,为了直观理解...如果在不使用归一化方法且特征分布十分不均匀的数据集上的代价函数上运行梯度下降法,必须使用一个非常小的学习比率,因为如果是在这个位置,梯度下降法可能需要更多次迭代过程.
?
直到最后找到最小值....的差别很大的范围内,而是都在-1 到 1 的范围内,或者相似偏差,这使得优化代价函数变的更简单更快捷....实际上,如果特征 x1 范围在 0~1 之间,x2 在-1~1 之间,x3 在 1~2 之间,它们是相似范围,所以会表现的很好,如果在不同的取值范围内,如其中一个从 1 到 1000,另一个从 0 到