介绍
回归分析是一种统计技术,用于确定目标变量(例如房屋价格)和输入参数(例如位置、建筑面积、便利设施等)之间的关系。
换句话说,它演示了目标变量的值如何响应输入参数值的变化而变化,即输入和输出变量之间的相关性。
从机器学习的角度来看,它帮助我们预测连续值数据集的结果,并用于价格预测、库存预测、时间序列建模等。
回归技术本质上有助于训练机器学习模型,以查找历史数据中存在的数学模式/趋势。此后,当出现新的数据点时,模型会尝试根据其以前的数据学习来预测结果。
回归类型
数据科学家或 ML 工程师可以使用多种回归技术进行预测。根据用例、业务假设、数据集的分布等选择特定类型的回归分析。下面我将介绍一些必须知道的回归分析类型。
1. 线性回归
线性回归是应用最广泛的回归技术之一。
在这种方法中,我们假设因目标变量(Y)和独立输入参数(X)之间存在线性关系。
方程:y=mX+c
公式:
“m”表示直线的斜率或梯度
“c”表示Y的截距点
根据因变量和自变量的数量,线性回归分为两种类型:
简单线性回归
多元线性回归
线性回归的一些实际应用有:
销售预测
应用程序上的“ETA”插件
价格预测
线性回归图:
2. 逻辑回归
逻辑回归是一种用于解决分类问题的回归方法。与目标/因变量是连续的其他回归技术不同,这里的因变量是离散的( 是/否;1/0;开/关;利润/亏损;头/尾等)。
方程:
公式:
“x”是作为输入传入的任何给定实数。
“e”是自然对数的底数。
根据我们要解决的问题类型,逻辑回归分为三种类型:
二进制输出(真/假;垃圾邮件/非垃圾邮件)
多输出(狗、猫、鼠)
序号输出(低、中、高)
Sigmoid函数产生S形(Sigmoid曲线),其最小值接近零,最大值接近1。
逻辑回归的一些实际应用包括:
垃圾邮件过滤
客户评论情绪
图像分类
逻辑回归图:
3. 多项式回归
多项式回归用于在非线性关系中查找因变量和自变量之间的关系。与线性回归不同,线性回归的图形是一条直线,而多项式回归倾向于曲线以拟合最大数据点。
方程:
公式:
上面的方程表示“k”次的单变量多项式
“β”是权重或回归系数
“X”表示自变量
在多项式回归中,方程中的每个元素都可以取任意“k”值,而在多元线性回归中,一个元素可以取多个变量,但必须具有相同的次数(“k值”)。
线性回归的一些实际应用有:
疾病的传播速度
发生灾难时的伤亡预测
多项式回归图:
领取专属 10元无门槛券
私享最新 技术干货