











梯度下降算法也变成多个:








正规方程 | 梯度下降法 |
|---|---|
不需要学习率 | 需要学习率α |
一次计算 | 需要多次迭代计算 |
因为要计算(XT * X)-1(也就是逆矩阵),复杂度很高,为log(n^3),所以特征变量多的时候很慢 | 很多特征变量的时候运行很好 |
有时候XTX是不可逆的(奇异矩阵)。造成不可逆的原因通常是以下两个:
1、有冗余特征: 有两个特征之间存在着一定联系,比如一个单位x1是米,另一个x2单位是千米,但表示的是同一个特征,这时候这两个特征之间存在着关系x2=x1。 根据线性代数的知识, 线形相关的矩阵不可逆的。
2、特征数n>训练集数m
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。