科技的进步以及市场经济的发展将我们带入了一个崭新的信息时代。数据挖掘技术作为一门多学科交叉的新兴技术,应用于商业、医学、科研等多个领域。审计人员在工作过程中需要从企业海量的会计数据中获取审计证据,通过数据挖掘技术的运用,可以有效地提高审计效率、降低审计风险,从而最大程度地保证审计质量。
什么是数据挖掘技术?
数据挖掘是指从大量的、不完全的、随机的数据集合中抽取出隐藏在其中,先前没有被人们发现,但又是有用的信息和知识的过程。它可以帮助决策者发现历史数据和当前数据之间潜在的关系,预测未来可能发生的行为,从而达到帮助决策者做出正确决策的目的。
数据挖掘在审计中的主要应用层面
1. 内控制度的符合性测试
审计人员可以借助企业自身安装的审计挖掘软件对企业内控测试的风险进行评估。这些软件可以帮助审计人员发现企业的高风险交易、编制例外事项报告等。通常这些软件能够记录计算机的使用痕迹,从而测试一些控制环节,帮助审计人员进行内部控制的评估,发现控制系统的不足,追根溯源,提出改进意见。
2. 实质性测试审计
通常情况下对被审计单位进行全面审计是存在困难的,但是采用适当方法选取样本进行审查会存在抽样风险,从而可能使审计人员得出错误的结论。数据挖掘技术由于其强大的数据库和算法功能,可以高效的帮助审计人员在较短的时间内筛选出具有代表性的样本,运用多种数据挖掘技术进行分析,发现存在的问题,降低审计风险。
数据挖掘审计的基本路径
1. 数据采集
数据采集与准备即建立数据挖掘库。将各部门提交的统一格式的审计数据收集整理,将数据日志纳入系统信息整合形成数据库逻辑上的一个子集。获取大量数据是数据挖掘技术的工作起点,数据库的建立关系着后续挖掘工作的顺利进行。
2. 预处理
由于收集到的数据可能有噪声或者缺失,因而必要时需要对数据进行调整和整理,包括格式转换、数字净化、提炼等等。审计人员应当在正式挖掘前剔除数据库中的干扰数据,将其转换成可以识别的审计专用格式,以便提高数据挖掘的准确性。
3. 发现规律与异常
选取合适的挖掘模型,运用正确的数据算法,审计人员可以通过结合自身的从业经验,结合被审计单位的行业状况、业务特点和数据模式,发现所获取的数据中隐藏的规律,从而找到异常数据。
4. 结果分析
并非所有数据挖掘出来的结果都具有实际意义,因而实施数据挖掘的审计人员需要结合实际情况,将数据挖掘的结果整合到财务系统中去,通过分析将实际数据与模型进行对比,调整模型。或者重新选择数据重建模型直到找到最合适的模型为止。
常见数据挖掘软件
1.weka
Weka,全名为怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费非商业化的数据挖掘软件,是基于JAVA环境下开源的机器学习。用户可以在官方网站下载它和它的源代码。
2. Orange
Orange是一个基于组件的数据挖掘和机器学习软件套装,其具有快速且多功能的可视化编程前端,以便浏览数据分析和可视化。它包含了完整的一系列的组件以进行数据预处理,并提供数据账目、过渡、建模、模式评估和勘探等功能。
3. Rattle
Rattle提供了一个图形交互界面,将数据转化成易于建模的形式。Rattle会有一个Log 记录,任何在Rattle操作的行为所对应的R Code都很明确的一步一步记录下来。
领取专属 10元无门槛券
私享最新 技术干货