科技创造未来——大数据与商业银行的审计
摘要:利用计算机强大的计算能力和数据处理能力,可以帮助审计人员快速锁定风险。要具体实现计算机代替某些审计工作,却是一个相当棘手的问题。由于商业银行储存的业务信息繁多,在非现场审计中不可避免地会与大数据打交道,而数据处理技术就是审计的关键。为了了解大数据在审计中的应用,华中科技大学光学与电子信息学院赴郑州等地”调研创新软件团队的工作模式和管理方法”暑期社会实践队在郑州睿诚金审软件科技有限公司,继续详细研究审计软件在发现风险、构造风险地图等审计工作中的原理和关键技术。
背景知识
什么是大数据?
中国科学院计算技术研究所李国杰院士认为:大数据就是“海量数据” 加“复杂数据类型”。在银行系统中,业务流水、客户、内部人员等信息的数据结构复杂,数量庞大,难于清洗并挖掘出有针对性的可用于审计的数据。是名副其实、难于处理的大数据。
什么是数据清洗?
审计必须从数据出发。因此要从银行客户数据库中要获取到审计软件所需要的数据。由于银行系统数据极度复杂,银监会发布的指引为银行数据结构设计留下了一些空间,因此,各个银行拥有不同的数据结构。从这些不同的数据结构中提取有用的数据,并向银行索要缺省的数据,最后再将其整合为一个结构化的数据模型的过程,叫做数据清洗。
什么是数据挖掘?
数据挖掘或称知识发现,指从大量数据中挖掘出隐含的、先前未知但潜在的有用信息和模式的一个工程化和系统化的过程。具体而言,在审计软件的开发中,对大量银行数据进行数据挖掘工作,得到某项风险发生时相关数据的特征,最后根据特征结果构造审计模型,达到预警风险的目的。
什么是审计模型?
利用数据挖掘的结果或者审计人员的审计经验,选择审计观察的数据变量,构造有一定的逻辑语句,再设定好参数的,可以供计算机计算出风险结果的一套流程。它是非现场审计的关键,一般来说属于商业机密。
我们非常好奇审计系统是如何发现银行的各项业务中存在的风险的,于是开始了审计系统原理的研究。经过王老师的指点,我们首先分析了审计要找出的对象:风险。一般的风险分为以下几种:内部欺诈风险(Internal Fraud)、外部欺诈风险(External Fraud);客户、产品与商业行为风险(Clients, Product & business Practices )、执行交割和流程管理风险、经营中断和系统错误风险、雇员行为与工作场所管理风险、物理资产破坏风险。
有风险就有需求,根据风险,可以提出审计系统需要解决什么问题。首先,审计系统要能够整合好风险的有关信息,其次,审计系统需要识别出潜在的风险,需要将历史风险整合起来,便于软件开发者做数据挖掘和模型构造等后续开发工作。同时为了给决策者提供意见,审计系统还需要给出可视化的审计报表,即风险地图。风险地图内容要有风险的等级、影响这些内容。这就要求审计软件系统是一个功能的综合体。
审计软件首先将来自于商业银行的数据迁移至专用的审计数据库内。此过程需要用到数据迁移技术。数据迁移技术并不是简单地将数据复制粘贴,它包含了数据清洗、数据装载以及数据转换的复杂过程。审计软件系统通过ELT架构的ETL工具实现数据的动态迁移,即定期甚至实时迁移数据以供分析。首先对于银行各业务数据库数据进行数据抽取并加载至目标数据库,然后在目标数据库进行数据的转换,通过查询,替换残缺数据以及格式错误数据等手段确保数据有效、完整且格式规范。最后对数据进行校验,控制数据质量。
根据这些数据,审计系统可以针对某一项业务流水进行特定风险的分析。软件首先调取这个业务这一风险的审计模型,再按照模型的要求调用所需的数据,再用模型中的逻辑来运算,和模型中预设的参数进行比较,最后给出一个有关风险的判断结果。
审计模型是这个系统的核心部分,要构造模型,必须用到数据挖掘技术。通过这项技术可以发现发生各种风险发生时的数据变动情况,哪些数据会过大,哪些数据偏小,哪些数据没有等等,当挖掘到这些数据特征以后,审计人员就可以根据结果和经验来设计审计模型,最后达到让计算机代替人工进行审计的目的。
经过我们认真学习和王老师的教导下,我们逐渐弄清楚了审计软件系统是如何工作的。在惊叹这种巧妙设计的同时,我们也更加敬佩王老师丰富的专业知识和严谨的学术作风了。王老师说,审计信息化很久以前就有了,很多大数据技术也不是近几年才出现的,王老师刚入这一行的时候,他就已经在做关于大数据的内容了。这种技术的应用在金融行业及其广泛,而且远不限于审计这一块。如果以后有兴趣的话,我们甚至可以跟着王老师去具体学习数据挖掘的方法。
从这次实践活动中,我们也发现在学科交叉的地方,需要复合型人才。在实践中,既懂金融、又懂计算机的人少之又少。这告诉我们,在学校的学习中,不要拘泥于自身的专业,应该多多学习专业以外的内容,甚至是学习看起来与本专业毫不相关的知识。书到用时方恨少,储备知识没有坏处,毕业后会对什么工作感兴趣,什么时候又要用上这些知识,谁知道呢?
领取专属 10元无门槛券
私享最新 技术干货