逻辑斯谛回归是统计学习中的经典分类方法。
逻辑斯谛分布的 PDF 和 CDF 函数曲线如下图所示:
二项逻辑斯谛回归模型是一种分类模型,其由条件概率分布 P(Y∣X)P(Y | X)P(Y∣X) 表示,形式为参数化的逻辑斯谛分布。随机变量 XXX 取值为实数,随机变量 YYY 取值为 111 或 000,我们通过监督学习的方法来估计模型参数。
对于给定实例 xxx,按照上式分别计算 P(Y=1∣x)P(Y = 1 | x)P(Y=1∣x) 和 P(Y=0∣x)P(Y = 0 | x)P(Y=0∣x),然后比较两个条件概率值,将实例 xxx 分到概率值较大的那一类。
几率:一个事件的几率是指该事件发生的概率与该事件不发生的概率的比值。如果事件发生的概率是 ppp,那么该事件的几率是 p1−p\frac{p}{1-p}1−pp,该事件的对数几率或 logit 函数是 logit(p)=logp1−p\mathrm{logit}(p) = \log{\frac{p}{1-p}} logit(p)=log1−pp
对于二项逻辑斯谛回归模型,其 logit 函数为
logP(Y=1∣x)1−P(Y=1∣x)=w⋅x+b\log{\frac{P(Y = 1 | x)}{1 - P(Y = 1 | x)}} = w \cdot x + b log1−P(Y=1∣x)P(Y=1∣x)=w⋅x+b
也即是说,输入 Y=1Y = 1Y=1 的对数几率是由输入 xxx 的线性函数表示的模型,即逻辑斯谛回归模型。
这样,问题就变成了以对数似然函数为目标函数的最优化问题。逻辑斯谛回归学习中通常采用的方法是梯度下降法或拟牛顿法。
二项逻辑斯谛回归可以推广为多项逻辑斯谛回归模型,用于多类分类。假设离散型随机变量 YYY 的取值集合为 {1,2,⋯ ,K}\{1, 2, \cdots, K\}{1,2,⋯,K},那么多项逻辑斯谛回归模型是
P(Y=k∣x)=exp(wk⋅x)1+∑k=1K−1exp(wk⋅x),k=1,2,⋯ ,K−1P(Y=K∣x)=11+∑k=1K−1exp(wk⋅x)P(Y = k | x) = \frac{\exp(w_k \cdot x)}{1 + \sum_{k=1}^{K-1} \exp(w_k \cdot x)}, k = 1, 2, \cdots, K-1 \\ P(Y = K | x) = \frac{1}{1 + \sum_{k=1}^{K-1} \exp(w_k \cdot x)} P(Y=k∣x)=1+∑k=1K−1exp(wk⋅x)exp(wk⋅x),k=1,2,⋯,K−1P(Y=K∣x)=1+∑k=1K−1exp(wk⋅x)1
其中,为了简便,wk=(wk(1),⋯ ,wk(n),b)Tw_k = (w_k^{(1)}, \cdots, w_k^{(n)}, b)^Twk=(wk(1),⋯,wk(n),b)T,x=(x(1),⋯ ,x(n),1)Tx = (x^{(1)}, \cdots, x^{(n)}, 1)^Tx=(x(1),⋯,x(n),1)T;x∈Rn+1,wk∈Rn+1x \in \mathbf{R}^{n+1}, w_k \in \mathbf{R}^{n+1}x∈Rn+1,wk∈Rn+1。二项逻辑斯谛回归模型的参数估计方法也可以推广到多项逻辑斯谛回归模型中。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有