大数据系列技术的分享,继中台DC和影像管理平台之后,今天由万德鹏、杜艳锋带来运营风险监控平台的技术介绍。
****万德鹏、杜艳锋,均于2013年入我行,分别曾参与BPM、集中提回平台, xbank2.0、集中IT平台的开发建设工作,目前两人负责运营管理、作业流程总控平台及板块大数据应用*****
银行本身就是经营风险的企业,风险监控和管理是信息系统建设非常重要的部分。提到运营风险监控平台的大数据应用思路,万德鹏总结说:“我们一直要寻找技术和业务的结合点,现在满眼都是大数据技术,而风险领域又非常适合使用数据挖掘、机器计算等先进技术,那我们就想,何不利用它对业务进行一次有规模的变革,于是就开始了一次‘郎情妾意’的创新结合”。对于该平台的技术创新点,万德鹏、杜艳锋为我们总结了如下两个方面。
一、全面利用分布式架构和大数据技术,提供高效多样的计算能力,支持运营风险监控模型化体系升级
运营风险监控平台依托我行分布式基础集群,利用大数据技术,建设了批处理、流处理计算模块,同时与大数据团队充分合作,开始了机器学习模型的探索之旅。其中:
批处理模块:分布式计算,采用inceptor sql为计算语言,围绕其打造了完善的发布体系、参数体系,同时建设ETL模块和调度模块,使其具备承载大量模型计算及传输的能力。
流处理模块:万德鹏指出反应时间是风险防控的重要指标,越小效果越好,今年很重要的工作就是实现了实时风险监控,以spark streaming+kafka+redis为核心流处理技术,搭建了实时模型计算模块,同时在部领导的规划和技术管理中心、大数据团队的支持下,首次在我部标准实时处理体系中进行了业务交付,目前已经相继引入了柜面、手机银行、网银、金卡等6个系统的实时交易数据。
机器学习:机器学习模型并没有自建计算模块,而是充分利用大数据架构开发中心建设的机器学习平台,经过深入探讨,实现了境外违规取现的智能模型,取得了业务人员很大的认可。
万德鹏说到:“同时,所有的创新都应专注交付,风险监控平台的计算体系,在客户信息及账户管理、内部账户及资金交易、客户账户交易、员工操作行为、资产业务、实物保管六大类业务下,涉及三十余多系统的数据,今年相继交付了113个模型”,分别为:
4个准实时风险模型,个人账户异常小额批量转账、柜员大量查询客户信息、柜员分拆存款逃避授权交易、柜员自行办理本人账户等监控模型,盗刷模型也进入了线上验证。
108个批处理T+1模型,如个人大额外币现钞存取款交易、非法买卖银行卡境外洗钱套现、柜员逃避监管私自用印、盗用客户资金交易等。
1个机器学习模型,境外违规取现。
二、搭建了从对接到应用的完整数据应用闭环体系
运营风险监控平台搭建了两个体系,一是上面介绍的大数据计算体系,该体系以分布式计算为架构基础,融合大数据批处理、流计算、机器学习等相关技术,具备高效、多样数据计算交付能力;二是运营风险作业流程体系,该体系以流程引擎为驱动,实现了高度配置化,并持续优化用户体验。
这样的体系架构分为三个层面:
一是数据层,对接各种数据,如DC的离线数据,通过OpenAPI采集的渠道实时数据等,进行加工、处理。
二是计算层,针对第一层的数据进行建模和计算,包括批处理计算、流处理计算,分别支持T+1、实时的风险监控与预警。
三是风险作业平台,完成了数据计算到数据应用的闭环,该平台以流程化为核心,作为前台提供给业务人员使用,提供风险标签、模型参数,核查任务等配置能力;交易流水、渠道流水、客户信息、各类名单、运营影像等超百T数据秒级查询,并根据风险监测结果,对接相关业务系统提供对公对账、锁名单、系统权限控制等联机处置,
对于该平台的使用效果,杜艳锋告诉我们,自上线以来,每天处理数据达10亿级,核查出风险事件(18303)条,锁定账户(5391)个,不论从监管层面还是降低账户管理成本方面均取得了极佳的效果,相关业务人员也反馈:“运营风险监控平台现已成为我们进行风险管控最为重要的平台,我们每天都在使用它。”
好了,今天的技术分享就是这些了,下期将为大家分享“自主开发的内存数据库”,敬请期待。
领取专属 10元无门槛券
私享最新 技术干货