首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能背后的“操盘手”,向前金服智能风控迭代实录

先进商业模式成功的根本,在于是否能比以往更高效地解决传统模式未能解决的问题,这也是互联网金融的价值和意义。而不断迭代服务提升核心业务的数字化程度,也是互金企业获得持续生命力的必须条件。

今年8月,向前金服迭代了其智能风控平台“听风者”,更好地释放人工智能的技术势能,同时发挥专业人才的丰富经验优势。

“‘听风者’3.0并不是平地起高楼,而是在原有的坚实地基上,对向前金服风控战略的延续执行。”捷越联合合伙人、向前金服CRO金可冶介绍说。

都说九十分的战略,执行时往往只剩六十分。怎么保证战略执行上下同欲?在向前金服迭代升级“听风者”3.0的过程中,金可冶的方法是任务分解。为模型、策略、技术等不同模块分别设置针对性目标,通过统筹协作让整艘“战舰”朝着智能化的大方向前进,更进一步加固了金融科技的安全生命线。

特征工程,小变数带来大帮助

对模型与应用团队负责人杨林来说,这个任务是“稳定性”。这是牵引3.0模型的“北极星”指标,从数据质量、衍生变量、模型架构铺陈展开。

其中,特征工程是保证数据质量的关键,也就是通过对底层数据的清洗、衍生,提取对训练模型有价值的特征这一过程。

所以,大量的数据筛选、测试工作是整个项目的开端,也是奠定基础的一步。然而,“两个月过去了,我们却发现有些数据准确率不符合要求。”面对这些数据和一天天过去的时间进度条,杨林的恼火和着急无法言说。“但底线是不能妥协的”,不得已,杨林选择更换方案,重新换了一批数据样本。

当初的煎熬过后,现在回看,杨林并不认为这部分工作是浪费。“数据是核心,我们测了双倍的量,在评估效果、检测稳定性上可选择的余地更多了。”任何事都有利有弊,这个变数反而对之后的数据处理和变量选取起了不少帮助。

金可冶曾在接受媒体采访时说,“大数据听起来很高大上,实际上梳理起来是一个非常累、接地气的体力活”。

在数据处理中,不同来源的数据格式都不一样,模型团队要把它们做标准化处理,这个过程就是数据清洗。“慢慢地,你会看到干净的数据集市。”杨林把这个过程,比喻成做菜中给食材改刀的阶段。在数据清洗过程中,一些有价值的数据,像是自带闪光点,让他眼前一亮,他就赶紧打好标记以备之后使用。

同时,数据获取方式要规范,不仅严格筛选技术手段合规的数据源,而且在数据传输全流程采用不可逆的加密算法进行脱敏处理。遵守操作规范,“菜品”才不至于变质。

接下来,还需要一个“腌制入味”的过程。数据清洗后,“我们在基础字段上做衍生,对数据互相之间做加工,让它们产生不同的关系”。当从无数个变量中找到特别有力的变量时,杨林会格外兴奋。这是最让他有成就感的时刻,因为觉得“离自己夸下的海口更近了”。

事实上,在项目启动之初,杨林就跟金可冶提出,这次模型会实现突破性进阶,“要稳定,精确度要高,要定制化建模”。而那个时候,数据清洗结果如何都尚待揭晓,他心里多少有点打鼓。

而之所以敢拍下胸脯,一方面源自公司掌握的具备一定规模且多元的数据量;另一方面则来自于对专业团队的信心。

当数据处理完毕、变量提取结束,一个规模上万的衍生变量池呈现出来。杨林心里才觉得,“稳了”。接下来,就进入建模环节,开始“脑力劳动”。

3.0模型与此前模型面对的任务截然不同,1.0作为向前金服智能风控的开山鼻祖,承担着“用户教育”的使命,需要向相关部门展示模型的运行方式和作用。

1.0、2.0相继投入使用后,算法模型的威力已经生动地展现在了大家面前,大家对于模型的作用有了认识和信任。这让3.0模型有了挑战更高级的机器学习算法的基础,“我们采用了XGBoost、随机森林等算法,可解释性相对弱一些,但是精度更高”。杨林说。

策略实施,小经验隐藏大门道

如果说高阶模型是“听风者”3.0的第一道杀手锏,那第二道就是差异化风险定价策略。拥有了兼具精准度和稳定性的模型,怎么使用和发挥这个好工具的作用,就是策略团队展示功夫的时候了。

风控工作最累的是数据清洗,最难的则是定义用户,给不同的风险要素打标签。“标签打不好,机器学的都是错的,算法再好都会走向错误的终点”。所以,在变量衍生过程中,策略团队的经验就发挥了重要作用。“他们接触业务更深入,对风险点更加敏感,在头脑风暴中提出了很多不易发觉的点。”杨林说。

比如,年龄、居住状态是单独字段。一般认为非独居的风险更低一些,但当两个字段交叉,一个非独居的借款人,如果年龄偏低,那事情就不一样了。类似的衍生变量,非常需要经验人士的参与。

随着金融科技的发展,科技不断向世人展示着自己的高超技艺,但在风控中,人的经验与技术的边界如何划分,成为人们常探讨的话题。

在金可冶看来,“风控人才从来不来自于书本,而是实战,技术与人的经验不应该割裂,而应是互补关系。”模型是在大数法则下给出一个概率,而经验丰富的风控人才要处理个案,从这个概率里面再找出确定性,进一步降低风险。

并且,智能化背后所凝结的,就是从事风控的人日积月累的经验结果输出。比如,随着越来越多竞争者的涌入,原先一些资产优质的好土壤,遭到了破坏。所以,在3.0风控策略上,对借款用户的信用风险进行了更细颗粒的划分和管理,较2.0版本增加10个评分等级,同时结合不同地区特色实施差异化策略。

金可冶认为,风险不仅意味着损失的可能性,还有结果的波动性。波动由结果和预期出现偏离带来,负向偏离就是损失,正向偏离可能代表着放弃了本可以服务的客群。而这个波动性,由很多的不确定组成。“从大的方向说,经济环境、监管政策、行业现状,都隐藏着风险信号。往小了说,公司的发展战略、业务目标、数据指标,都是策略制定需要仔细考虑的微观因素。”金可冶说。

不可忽视的事实是,即便其他因素不发生变化,用户在经过这些年的市场培养后也在变迁。过往的一些“好”用户,可能已经变质,而拓展新的用户群,是企业提升竞争力的必然选择。

金可冶曾在美国运通多年从事风险管理工作,颇受运通风控理念影响。他认为,风控不仅仅要推动利润增长,更要提供卓越的用户体验以增强竞争力。

“3.0在策略应用上的明显变化,在于优质用户可以享受自动化审批服务,体验更佳。”金可冶说。这样,“好像服务没有本质不同,但就是因为提供了‘好一些’的体验,就意味着在一个成熟市场拥有更大的竞争力。”

系统部署,小插曲显示高要求

到了今年5月,模型输出稳定了,策略制定完成了,工作交由向前金服技术团队风控产品经理韩涛接手,进入了部署上线的阶段。

“上线前,我们结合‘听风者’3.0模型的特点,搭建了一套动态的变量衍生体系。”韩涛说,类似这样的功能模块完善,也是在风控技术支撑上的变革。以高配置化为目标,从反欺诈系统到审批模型部署,以及资产管理的整个流程,构建可随时调用的服务层。“这是一个基础设施建设的过程,没有这一步,每次创新都得从头建设,而高配置化可以让创新实现起来简单很多。”韩涛说。

另外,3.0采用了机器学习算法,模型的架构复杂程度也近乎四倍于原先版本。这给部署带来一定的难题,也发生了让韩涛最为头疼的“小插曲”。“原来设想就是直接上线就可以用了,后来发现性能无法容忍。”

在整个跨团队的配合中,不同团队基于自身业务的特点考虑,产生龃龉在所难免。但在杨林看来,这是一个取舍的过程。

“我们认为模型相对复杂,两秒跑出一个结果是可以接受的。”杨林说。而在韩涛看来,在系统有高并发需求时,这样的承压风险难以接受。

于是,模型团队将模型脚本封装,确保保密性和独立性;技术团队对模型部署采用了服务改造的方式,将之形成高内聚、低耦合、可复用的抽象服务层。最终,实现了服务的毫秒级响应,同时也便于服务进行修改和扩展。

经过高频加班攻坚,终于迎来3.0上线试运行日。7月初,试运行当天,项目组并没有松一口气的感觉。“我反而更紧张了。测试过很多次,各种极端情况都实验过,但还是紧张。”杨林说。

果然,试运行当晚就出了一些小Bug,又是一个紧张的加班夜。凌晨三点,才最终完成。

“第一天就有坑,之后怎么办?”团队的第一反应,是马上搭建监控体系,对系统运行、模型能力进行全面的监控并及时预警。“第一个月试运行本来就是要查漏补缺,把可能出现的问题修复好,把监控报警机制做全。”韩涛说。经过一个月试运行,8月,3.0正式全面投入使用。

到现在,“听风者”3.0已经稳定运行两个月了,项目组才慢慢把心放下来。来不及谈成就感,马上就要步入对数据指标的监测,以及对下一代版本的思考中。

“我们会一直推进风控平台的迭代,但这种迭代是渐进的、温和的,从1.0到3.0不会有翻天覆地的变革。”金可冶重申了向前金服的风控战略:“提升四大能力,完善两大体系”。四大能力指风险识别能力、风险定价能力、资产管理能力、优质体验能力;两大体系则是标准化管理体系、标准化风险预测与监控体系。风控是整个业务的核心,每一步升级都要遵循战略路线,尊重业务逻辑。

那么,下一次升级是什么时候呢?

“3.0有完整的表现期和足够样本量之后吧。但是,3.1、3.2会不会很快发生?我相信明年上半年会有。”韩涛说。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190925A0AZIN00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券