2018年12月13日,Informatica成功举办了网络研讨会“人工智能+数据目录,专家解读数据资产管理智能化的驱动力量”,您是不是还在为未能参会而遗憾?莫急,下面是我们针对本次研讨会Informatica资深技术顾问金铎演讲内容的精彩回顾,您要的干货都在这里了!
Informatica资深技术顾问金铎
数据资产管理应该重点考虑的三个方面
我们认为企业在进行数据资产管理时应该重点考虑如下三个方面:
第一,数据资产定义。在定义数据资产的时候,我们要考虑企业内部有什么样的数据资产,这些数据资产源于哪里,由谁和哪些业务部门负责?他们有什么样的业务含义?在业务的运营过程当中产生了什么样的价值?
第二,数据资产评估。此时,我们要考虑这些数据的来源和路径。因为数据不像是固定资产不动,他们会有流动性。我们要了解数据从哪儿来,要到哪去儿?这些数据资产的质量如何?是否可用?能不能满足我们业务的需求?能不能满足分析需求?是否做好了审查和监控?能不能满足我们业务考核的合规需求等。
第三,数据资产管理与使用。当这些资产被评估好之后,我们要考虑这些资产是如何被使用的?如何通过数据资产共享,在不同的业务部门之间把数据资产的价值发挥到最大化。同时还要考虑数据资产的维护和安全。
企业数据目录如何帮助企业管理数据资产?
Informatica的企业数据目录产品Enterprise Data Catalog(EDC)能很好的满足上述三个方面的需求。EDC借助我们的智能元数据平台CLAIRE所拥有的AI技术,将企业内外部的技术元数据与其对应的业务场景、用户注释、数据关系、数据质量和使用用途等通过统一的视图关联在一起,来帮助企业的业务和IT用户共同实现数据资产价值的最大化。
在数据资产定义方面,无论数据位于企业内部,还是外部,甚至云端;是以结构化或者非结构化的形式存在;无论是数据字典还是主数据,亦或是传统的业务数据、交易数据、多媒体数据、日志数据等,都能够纳入到Informatica的管理范围之内。这些数据无论是分布在业务系统、ODS、数据仓库,还是从第三方获取的数据,Informatica都可以有效地把它们管理起来。同时,所有的数据都富有其业务含义和业务意义,Informatica能够有效地把这些业务含义和业务意义与业务资产关联起来,使得数据成为整个企业的资产,而不仅仅只是IT资产。
在数据资产评估方面,Informatica会对数据的流向、各自之间的关系和影响进行分析。也会评估数据的质量,包括数据的完整性、唯一性、重复性等。还能从关注度和使用频率方面对数据资产进行评估。在数据资产的管理和使用过程中,无论是数据资产的安全,还是数据资产的定位,以及业务和技术的融合方面,Informatica都会提供很多智能化的功能进行辅助。采用类似Google的便利检索,通过AI技术实现数据标签和自动推荐等功能。
AI驱动数据资产管理智能化
发现数据只是开端,充分了解数据才是核心。Informatica企业数据目录在对不同维度数据资产的元数据进行管理之后,会利用CLAIRE人工智能引擎把资产的很多属性通过自动计算的方式提炼出来,同时提供快速的数据智能检索功能、资产之间的关系发现及全貌视图等很多核心功能。
举个例子,当我们做一个企业级数据目录时,数据可能会分布在很多不同的系统和不同的资源当中,这时候检索数据、定位资产就是一个非常困难的事情。就像图书馆如果没有一套很好的图书管理系统帮助快速定位,读者就会迷失于茫茫书海当中,找不到自己想要的图书。Informatica的智能检索功能可以帮我们快速定位数据资产,它能够从多个维度对数据资产进行自动识别和分类,同时会自助给资产打上很多标签。它可以根据不同用户对资产使用过程中加注的标签,以及用户的使用习惯,自动地给不同的用户推荐与其相关性最高的资产,或者和他搜索的资产关联性最高的资产,帮助用户尽快找到自己想要的资产。
Informatica企业数据目录通过采用人工智能技术,具备了如下独特优势:
§ 利用人工智能技术对所有类型的数据进行自动编目及分类
§ 借助类似Google的强大搜索功能,快速定位数据资产并展示其360度完整视图
§ 业务和IT人员均可通过众包式注释功能对技术与业务元数据进行完善
§ 业务用户可以快速发现并定位数据,便捷管理业务术语、定义、参考数据和其他数据的生命周期
问答环节提炼
§ 企业数据目录与传统元数据管理的区别是什么?
§ 企业数据目录支持哪些数据资产类别?
§ 企业数据目录和数据治理有什么关系?
想知道答案,赶快扫描二维码吧!
领取专属 10元无门槛券
私享最新 技术干货