然而,具有讽刺意味的是,除非你是在一个专业领域,如计算机视觉或自然语言处理,很多时候,简单的模型,如线性回归, 实际上比复杂的黑箱模型,比如神经网络和支持向量机,能更好地解决你的问题。...毕竟,线性回归模型是:
快速训练和查询;
不易过度拟合和有效利用数据,因此可应用于相对较小的数据集;以及
很容易解释,即使对非技术背景的人也是如此。...线性回归假设
线性回归的基础是五个关键的假设,所有这些都需要保持模型产生可靠的预测。具体地说:
线性:输入和输出变量之间的关系是线性的。...将直线回归线拟合到该数据(红线)将导致对所考虑范围中间的输入变量(x)值的输出变量(y)的预测过高,以及对范围任一极端的x值的预测过低。...例如,在上面的例子中,我们可以创建一个新的变量,z = x²然后符合我们的线性回归模型使用x和z作为输入变量。