数据猿导读
如今,虽然很多银行还没有设立单独的像“大数据部”这样的机构,甚至还没有成文的大数据战略规划等纲领性文件,但每家银行都把大数据作为一项非常重要的战略及措施在推进。
记者 | 郭敏
本文长度为3400字,建议阅读7分钟
日前,访谈小组人员来到了国内某股份制商业银行(以下称:G银行)。这次的访谈跟数据猿以往走进银行的情况类似,也跟笔者来G银行之前的心理预期很是接近。刚进大厦一楼就被安保人员拦下,带到了来访者登记台,并告知一定要使用身份证才能办理出入卡,而且还要临时“扣押”身份证直至离开大厦才能归还。一进门的“下马威”着实让笔者体会到了何为管理“森严”,真是“银行无小事”的传言,一点都不为过!
在数据分析应用和团队的建设方面,G银行可以说走在了行业前列。此次,接受笔者采访的是G银行信息处负责科技规划、企业级架构的D先生。技术出身、IT行业老兵的他,在面对笔者提问的时候却能侃侃而谈,打破了笔者心目中原有对IT技术人的“刻板”印象。
大数据从“虚”到“实”
2011年中旬,麦肯锡全球研究院发布了名为《大数据:创新、竞争和生产力的下一个前沿》的研究报告后,大数据的概念迅速得到了IT界的火热追捧。之后沃尔玛关于啤酒和尿不湿的案例成为众多数据分析公司老生常谈的话题,但后来却一直没有更多实质性的成功案例,所以,当时的大数据市场虚火很旺。
这几年,国家层面相关政策的出台和企业IT数字化转型的实施为大数据产业的发展推波助澜。D先生说道:“现在,大数据行业已有些沉淀,并逐渐开花结果了。”原因何在呢?D先生以银行大数据应用发展为例做了说明:银行应用系统中储存了大量结构化的数据,除此之外还有诸如客户投诉、留言等类结构化或者非结构化的数据。银行除了自有的海量数据之外还会购买外部数据,如何利用已有数据跟外部数据进行有机结合是各家银行都在做的事。更丰富的数据类型,更广泛的数据种类,更灵活的数据应用是基于银行传统数据分析生态的更多外延和扩展。
现如今,大数据已经在各行各业得到了广泛应用。以电商、第三方支付平台为例,它们亦是将客户的购买行为和交易记录等作为数据源,并通过与外部数据的整合达到精准营销的目的。D先生告诉笔者:“讲概念的时候,大家都说大数据无处不在,真正从概念到落地还是看有一定的数据累积后怎么样才能使自身数据的范围更广,大数据已经走到了这样一个时代。”
体制下的“智能化转型”之路
如今,虽然很多银行还没有设立单独的像“大数据部”这样的机构,甚至还没有成文的大数据战略规划等纲领性文件,但每家银行都把大数据作为一项非常重要的战略及措施在推进。
在国内众多商业银行中,G银行对于大数据技术的使用相对较早,其历史数据查询系统就是基于大数据技术搭建的。在采访中D先生说道:“银行客户经常会有贷款或出国等方面的急切需求,需要银行账户的交易明细,长达数年甚至十多年的交易信息在系统中已经不再保存,为了更好的提高服务质量,G银行推出了历史数据查询系统”。
历史数据查询系统的构建给G银行带来了不小的挑战,数据量很大,数据查询效率要高,交易记录中又有敏感客户信息要保护,D先生说:“在系统选型的时候就有两种方案,一种方案希望用传统数据库技术去实现,另外的方案是使用新兴技术。经过一系列试验对比,最终我们选择使用Hadoop技术去实现。”毕竟现今企业数据仓库和关系型数据库擅长处理结构化数据,且成本昂贵,而Hadoop不仅能带来高效的大数据处理能力,也能大大降低存储成本。
D先生告诉笔者:“今年G银行把 ‘智能化’放到了比较重要的位置,在全行业务战略中明确提出了智能化转型的要求,银行科技部也设立了二级部门——数据服务中心,其主要承担数据质量管理、数据治理、数据分析等职能,利用大数据技术做风险共同体、滤镜等数据产品和模型”。
笔者了解到,除了上文中提到的历史数据查询系统,G银行还在客户画像、风险预警、监控等方面使用了大数据技术:通过网页爬虫技术获得更多企业信息,并与已经购买的外部数据相结合,对其进行分析得出画像,观察企业的异常情况,进行实时预警;利用大数据技术在运维领域做监控系统,通过日志分析结果观察系统的运行状态;利用大数据技术对安全态势进行感知,在安全事件发生前做好防护。
在跟D先生交流的过程中笔者明显感受到:G银行正在利用大数据技术大刀阔斧地推动“智能化转型”。那么转型的过程中是否也遇到了困难?具体遇到了哪些困难呢?
——人才是“硬伤”,对新技术应用相比互联网企业“保守”
应用需要大数据平台支撑,G银行也构建了自己的大数据平台。据了解,在大数据平台选型的时候,G银行并没有完全使用开源技术,对此D先生告诉笔者:“从技术角度讲,现在大数据领域主流的技术变化太快,对G银行来说,投入大量资源跟进技术的难度较大,尤其是在现有体制下,引进高端的大数据人才的难度很大,自己培养又有较长的时间周期。”
“基于金融系统稳定的重要要求,银行在使用新技术方面积极且审慎。在各家银行系统 ‘大集中’时代,如何避免系统的集中度风险至关重要,能够使银行无法开门营业的部门目前来看只有信息科技部门了。”D先生补充道。说到安全不由得联想起从年初到现在英航空IT系统、Facebook、摩拜、ofo等一系列宕机事件,作为金融领域的重要组成部分,银行对于国家的金融安全和稳定不能有丝毫懈怠,因此,积极审慎也不失为银行现阶段的一种合理的选择。
——外部数据质量堪忧,明细数据的获得难度很大
一般来讲,多数银行除了使用自有的数据外都会购买外部数据作为补充。据了解,G银行也购买了工商、税务等数据,对于银行来说外部数据是一种补充,建立起内外部数据的有效关联是关键。
D先生说:“目前来看外部数据的质量存在一定的问题,拿到的外部数据和行内相关信息较少能够建立有效的关联。对于部分第三方数据,看上去很美,毕竟被互联网企业视为核心资产的明细数据是不会轻易给我们的。”事实上银行更希望拿到淘宝评级的明细数据,而非给出的个人信用分数,但客户的明细数据是互联网企业的核心资产,得来不易。
——需借助外力合作开发
经过几年的发展,在企业级大数据服务的细分领域主要有四类玩家:传统集成商和软件公司、垂直行业解决方案公司、互联网巨头和新兴大数据创业公司。在过去的一段时间里国内大数据初创企业如雨后春笋般涌现。“大数据的进入门槛已经越来越低了。”D先生如是说,“到今天,但凡一个做数据分析的企业都说自己有大数据平台或技术,但是细聊之后就会发现他们只是在社区拿到了开源版本,并在此基础上读读代码、做做应用而已,具有核心竞争力的企业并不多。”
银行在做大数据项目的时候会选择跟外部厂商合作,当然G银行业也不例外。D先生告诉笔者:“我们对软件的稳定性、安全性,运维的可维护性、可管理等方面要求特别高,最终选择了跟国外的厂商Cloudera进行合作,因为它们的主核用的是Hadoop的标准版本,围绕这个版本又做了安全性管理、数据的隔离、运维的可监控,备份等一系列安全性的措施符合我们银行使用软件的要求。”
当被问到为何没有选择国内的大数据企业进行合作,D先生表示:“其实国内一些创业公司还是很优秀的,但银行采购IT基础设施要遵循国家办法规定的招采流程,流程里面有很多规定,比如说必须是三年盈利等,如此一来很多创业公司就不得不被排除在外了,这样也使银行的选择受到了限制。”
——业务部门缺乏数据分析机制
目前,大数据技术在银行中的运用从业务领域来讲主要包括以下三个方面:日常数据分析。在原有的数据分析基础上加入更多的大数据分析元素,在决策支持、客户分析等领域发挥更大作用;在风险领域的运用。在目前经济相对不稳定的情况下,一笔贷款损失需要若干笔正常贷款的收益才能填补,只分析一个企业的股权关系太片面,只有利用若干个企业的股权人、股权关系数据进行分析得出主要人员、关键财务人员和实际控制人之间的网络关系,才能了解企业整体的状况;还有银行内部的合规控制风险。基于柜员的登录日志,可以利用数据分析对风险进行预测,再比如,可以利用大数据技术对理财销售异常行为进行分析,有效控制“飞单”。
归根究底,数据分析还是为业务服务的。D先生表示:“技术部门的职责是把数据这道菜原材料准备好,至于煎炒烹炸端给谁,一线部门是最有发言权的。我觉得现在整体来看国内银行在这方面相比互联网企业在数据分析的差距还是比较明显的,这是机制和体制的问题。”其实客户的需求只有业务部门清楚,如果每家银行业务部门都有自己的数据分析团队,那么数据分析的目的性更强,行动力也会更好。
写在最后
探访完G银行,给笔者的最大感触是外部数据的质量、大数据人才缺乏、业务部门缺乏数据分析机制等不仅仅是G银行要正视的,也是各个银行在数据智能化道路上正在面临的问题,只有解决这些问题才能使银行在激烈的市场竞争中突出重围。