当delimiter='\t'时,被处理文件就是TSV。
读取文件的部分(适用于文件特别大的场景)
通过nrows参数,来设置读取文件的前多少行,nrows是一个大于等于0的整数。...3.4 查看异常值
3.4.1 检测异常的方法一:均方差
在统计学中,如果一个数据分布近似正态,那么大约 68% 的数据值会在均值的一个标准差范围内,大约 95% 会在两个标准差范围内,大约 99.7%...假设自变量有N种取值,因变量有M种取值,考虑自变量等于i且因变量等于j的样本频数的观察值与期望的差距。其统计量如下:χ2=∑(A−T)2T,其中A为实际值,T为理论值。...值 在实际操作时往往使用ROC曲线配合求出KS值
from sklearn.metrics import roc_curve
y_pred = [0, 1, 1, 0, 1, 1, 0, 1, 1, 1...).max()
print('KS值:',KS)
在金融风控中一般将用户违约率预测的概率转化为评分卡分数,转化过程常用以下形式:
#评分卡 不是标准评分卡
def Score(prob,P0=600,