为了找到最小误差的最佳参数,计算损失函数的偏导数的目的是什么?
考虑到线性模型的损失函数,我们希望找到最小误差的最佳参数。我不明白,考虑到损失函数的偏导数(相对于每个参数)等于0的参数,为什么这个结果可以实现。
发布于 2022-09-23 10:15:19
这是一个最小化的问题。典型的微积分方法是找出导数为零的地方,然后证明它是全局极小,而不是最大值、鞍点或局部极小。
在良好的情况下,如线性回归与平方损失(如一般最小二乘),损失,作为一个估计参数的函数,是二次和向上开放。因此,当我们找到一个导数为零的点时,保证它是一个全局极小值。
因此,开始取偏导数,找出它们等于零的位置。
现在以方程组的形式求解最优\hat\beta_0和\hat\beta_1。
对于为什么这个解是全局最小值,有一个几何上的争论,但是它可能值得去做一次多变量微积分的整个二阶导数测试,仅仅是为了看看它是如何工作的。
https://datascience.stackexchange.com/questions/114632
复制相似问题