1. logistic函数
定义:,当z趋向于正无穷时,g(z)趋向于1,当z趋向于负无穷时,g(z)趋向于,所以logistic函数的取值范围为(0,1)。
2.logistic回归简介:研究二分类观察结果与一系列影响因素之间关系的一种多变量分析方法。通常是研究在某些因素条件下某个结果是否发生,比如医学中根据一系列身体指标来判断某个人是否患有癌症。logistic回归主要解决二分类问题。
3.模型:
之前讨论过多元线性回归:。其中,
此时,z的取值范围可以是任意值,但每个真实数据的标记值(label)只能取或1值。因此,我们需要先将z映射到logistic函数:中,组成一个概率值:
4.参数估计:似然估计与梯度下降
对似然函数取对数得:
5.实例:自变量为性别、年龄以及薪水,因变量为购买意愿,属于二分类变量,其中1代表愿意购买,代表不愿意购买。
(1)数据读取以及描述性统计
(2)数据处理
(3)logistic regression
(4)预测
(5)模型评估
领取专属 10元无门槛券
私享最新 技术干货