其它挑选变量的方法如:GBDT、随机森林、相关系数、逐步回归等会在后续文章中详细说明。...用Python计算WOE和IV
接下来用一个实例说明如何在python中计算变量的WOE和IV
3.1 加载数据
由于篇幅原因,不在文中放具体数据,如需要,请到公众号中回复“用python计算iv”...计算单个变量的调用语句如下:
IV,cut,WOEi,d4 = bin_frequency(df['1个月内申请人在多个平台申请借款'], df['y'])
我们来看下得到的结果
IV值:0.39747...计算多个变量的循环调用语句如下:
columns_iv = [
'7天内申请人在多个平台申请借款',
'1个月内申请人在多个平台申请借款',
'3个月内申请人在多个平台申请借款',
'7天内关联...P2P网贷平台数',
'1个月内关联P2P网贷平台数',
'3个月内关联P2P网贷平台数',
'X3个月内申请人手机号作为第二联系人手机号出现的次数',
'X3个月内申请人手机号作为前三联系人手机号出现的次数