在卖房子这个例子中,我们用到的是线性回归模型。
首先介绍几个概念,训练集,即我们提供的由于房子大小及对应价格的一组数据集。在训练集中,我们用m表示训练样本的数量,x表示输入变量,y表示输出变量,(x, y)表述一个训练样本,(x^(i), y^(i))中的i表示第i个训练样本。
有了这些值,我们就可以建立一个算法模型:
其中h表示从x到y的一个映射。从最简单的开始,我们将h定义为一个线性回归模型,即h(x) = θ0 + θ1 * x,我们所要做的,就是确定θ0和θ1的值,使得得到的直线与训练集尽量拟合。
这里就要定义一个函数——代价函数(Cost Function)。
首先目的最简单,使得(h(x)-y)最小,或者(h(x)-y)^2最小,进一步,数据集的总和最小——>也可以写成
到这里,就可以定义出这个问题的代价函数了——
其中,又有h(x) = θ0 + θ1 * x,我们想要做的,就是关于θ0和θ1对函数J(θ0, θ1)求最小值。
领取专属 10元无门槛券
私享最新 技术干货