首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

控ML | 控建模的KS

我们这做控模型的时候,经常是会用KS值来衡量模型的效果,这个指标也是很多领导会直接关注的指标。今天写一篇文章来全面地剖析一下这个指标,了解当中的原理以及实现,因为这些知识是必备的基本功。...不过这不影响我们去使用它,我们只需要知道在控中是怎么实现的,并且在实际场景中怎么去使用它就可以了。就如上面我们说的,KS在控主要是用于评估模型的好坏样本区分度高低的。什么是区分度?...可以看下图: 从业务上来说,就是越往后的箱子,客户的质量越差,rate整体上呈现单调性,从而可以把大多数的坏人,直接从箱的维度上就可以区分开来了,在后续的控策略使用体验上十分友好。...02 KS的生成逻辑 KS的生成逻辑公式也是十分简单: 好样本累计占比坏样本累计占比 在控领域,我们在计算KS前一般会根据我们认为的“正态分布原则”进行分箱,一般来说分成了10份,然后再进行KS的计算...03 KS的效果应用 KS的值域在0-1之间,一般来说KS是越大越有区分度的,但在控领域并不是越大越好,到底KS值与控模型可用性的关系如何,可看下表: 004 KS的实现 首先我们来对上面展示的例子进行

4.6K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    如果没有这个设计模式,目前所有的编程语言都将不复存在!

    请问:Oracle数据库中怎么认识这条SQL语句的? 不好意思!Oracle没有limit这个关键字,不知道怎么处理这条语句! 那为什么MySQL数据库知道这条语句呢?...照理说,Oracle数据中也有解析器来解释SQL语句呀!是的呐~ 但是Oracle中的解析器所能解释的语言中没有"limit"这样的表达。...首先,恕小二这里不能实现上面数据库解释SQL这样一个例子!(小二实在是整不出一个数据库出来) 现在,小二以参观车展为例,模拟一个解释器模式。 我们要解析的语言结构是:xxx看车展。...小二的理解就是:本次解释器模式中任何的文本有哪些?这个需要定义出来。即,哪些语句是可以解释的。...外国人看车展,吃个冰淇淋,兜个!外星人看飞碟,,您不来自地球,咱们看飞碟去! 好了!我们的例子就结束啦!大家对此有什么想法呢?欢迎留言哦~ 总结 解释器模式的可使用场景少,复用性不太高。

    13840

    信贷控模型搭建及核心控模式分类

    E.应用场景 控模型的应用场景非常广泛,只要牵扯互联网金融的行业就缺少不了控模型的存在,从借贷的角度来看,平台要评估借贷者的个人征信和还款能力从而保证投资者的收益;从投资者的角度,要保证平台的资金安全...另外,控模型在不同的阶段体现的方式和功能也不一样。...从资金的角度来看,控模型是为了评估用户还款能力和还款意愿,反欺诈反作弊,防止用户薅羊毛和保证平台安全等功能;从行业的角度,互联网控模型体现在消费金融/供应链金融/信用借贷/P2P/大数据征信等方面。...所以说,控模型的计算策略和机制在一个公司属于绝密,规则除了核心的员工,其他人是不能知道控规则的。 四、控的核心 如果说金融产品的核心是控,那么控的核心是什么?...五、控模型的设计步骤 总体来说控模型的设计主要可以分为以下的几个步骤: 1.获取数据 信用评估来自于用户数据,模型规则其实就是用户数据规则,信息的纬度也比较广泛,大致可以分为基本信息/行为信息

    2.3K10

    利用windspharm库计算散度、旋度详细教程

    由于研究的需要,需要求解势函数从而得到散度、旋度。Python的windspharm库可以实现以上功能。故记录下来分享给大家。...文件放进上述文件夹,重复pip install即可 注意:同时该库对numpy库的版本有要求,如报错可以试着更新numpy库 使用 根据如下源码可知:该库存在一个巨大的缺陷,缺陷就是该库需要传入全球的场数据...,同时只能是二维或者三维的数据,且不能有nan值,否则使用的时候会报错,这是这个库的局限性,而且如果对数据进行区域切片后传入计算,那么计算结果会有巨大差异,导致不准确,所以说需要全球的场数据。...step2:导入VectorWind类,传入u,v实例化 from windspharm.standard import VectorWind w = VectorWind(u, v) step3:计算旋度并恢复数组形状

    1.6K20

    支付控模型

    这就需要对控模型进行合理的设计。一般来说,要提升控的拦截效率,就需要考虑更多的维度,但这也会带来计算性能的下降。在效率和性能之间需要进行平衡。...二、基于规则的控 规则是最常用的,也是相对来说比较容易上手的控模型。从现实情况中总结出一些经验,结合名单数据,制定控规则,简单,有效。 常见的规则有: 1....互联网金融控离不开机器学习,特别是支付控。 在各种支付控模型中,决策树模式是相对比较简单易用的模型。 如下的决策树模型,我们根据已有的数据,分析数据特征,构建出一颗决策树。...这个过程,将在下一篇的控架构中介绍。 五、模型评估 控本质上是对交易记录的一个分类,所以对控模型的评估,除了性能外,还需要评估“查全率”和“查准率”。...支付控场景分析 ; 支付控数据仓库建设 ; 支付控模型和流程分析(本文); 支付控系统架构 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn

    2K21

    【K爬虫普法】大数据控第一案:从魔蝎科技案件判决,看爬虫技术刑事边界

    图片 我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 特设了“K爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术...案情介绍 据魔蝎科技官网(现已无法打开)介绍,魔蝎科技成立于2016年,是国内领先的大数据智能控服务供应商,其将人工智能、大数据、区块链、云计算等前沿技术,深度应用于反欺诈、智能决策、信用分析等多个金融风险管理服务领域...曾为上千家金融机构、网贷平台等提供大数据控服务,曾系金融科技行业头部企业。...2019年之前,魔蝎公司等大数据控公司一度野蛮生长,其运营模式通常为通过网络爬虫技术获取数据信息,而后对数据进行分析使用,用于为下游提供大数据控服务。...据金融科技领域人士称,彼时现金贷行业流行一个“控奇招”——用一款被称为"同业爬虫"的产品,直接将其他现金贷平台的放款额和风控数据扒出来,相当于别家代为做了控。

    62210

    《破》大数据

    《破》非常燃,看完之后就想骑着单车冲上公路。这部影片中出现了大量有趣的数据,下面我们就逐个数理一下: 1、到底有多快 公路赛一般时速超过50公里,最快时速可以达到80至100公里。...2、一个车队有几个破手 一个车队通常有3个以上的破分手,是一个小组,而不是孤军奋战。 3、破手的价值是什么 自行车公路赛,是一项“速度越快,阻越大;阻越大,越耗体力”的极限运动。...为了让冲刺手保持体力用来最后冲刺,需要有团队来保护他,让他的阻尽量减少。 自行车在空气中的阻力和速度的平方成正比。测试表明,当车速度上升到每秒11米时,空气阻力便占前进总阻力的80%。...统计显示,一路跟着破手,在冲线之前,冲线手能够节省20%的体力。 2009年环法比赛的哥伦比亚HTC车队,冲刺王Mark Cavendish(马克·卡文迪)最终以70公里/小时的速度冲过终点。...这个惊人的速度背后,是世界知名的破手Mark Renshaw(马克·兰肖)一路的保驾护航。直到最后两百米,兰肖让出位置,自己滑行过线,卡文迪火力全开,为全队赢得第六次环法总冠军。

    93750

    麦克阵列声源定位程序_麦克阵列怎么设置

    麦克阵列声源定位(一) 利用麦克阵列可以实现声源到达方向估计(direction-of-arrival (DOA) estimation),DOA估计的其中一种方法是计算到达不同阵元间的时间差,另外一种可以看这里...那上面例子中的宽带语音信号,用GCC-PHAT方法得到具有陡峭峰值互相关函数,找到互相关最大时的点,结合采样频率 F s 与 与 麦 克 间 距 d Fs与与麦克间距d Fs与与麦克间距d,就可以得到方向信息...频域计算互相关参考另一篇博客 ##2.角度计算 上面的内容计算了两个麦克的延时,实际中假设阵列中麦克个数为 N N N,则所有麦克间两两组合共有 N ( N − 1 ) / 2 N(N-1)/2...N(N−1)/2对,记第 k k k个麦克坐标为 ( x k , y k , z k ) (x_k,y_k,z_k) (xk​,yk​,zk​),声源单位平面波传播向量 u ⃗ = ( u , v...,每两个麦克就可以得到一组上式, N 个 麦 克 就 会 有 N ∗ ( N − 1 ) / 2 个 等 式 N个麦克就会有N*(N-1)/2个等式 N个麦克就会有N∗(N−1)/2个等式,声源单位传播向量

    1.7K30

    控ML | 控建模中怎么做拒绝推断

    04 做拒绝推断都有哪些方法 这里的方法介绍,我在知乎上看到汪的相关文章,写得真的是太棒了!我比较难超越了,就把他的原文链接贴过来,大家可以去看看哦。...《控建模中的样本偏差与拒绝推断》https://zhuanlan.zhihu.com/p/88624987 不过我也还是把他文章里的分类体系在这里重点再次分享一下。...06 总结一下 本文算是一个对拒绝推断的入门介绍了,让初涉控模型的同学有一个相对来说比较清晰的全局认识,这里面涉及到的很多算法模型上的细节并没有展开来讲,因为我觉得这也会让阅读带来比较大的负担,公众号的文章还是要控制在几分钟内读完比较合适...Reference [1] 异常检测算法分类及经典模型概览 https://blog.csdn.net/cyan_soul/article/details/101702066 [2] 控建模中的样本偏差与拒绝推断

    1.8K30
    领券