文 / 中国光大银行信息科技部总经理助理 彭晓
以“数据、标准、技术、场景”为核心要素的智能运维体系构建
在当今全面数字化时代,“数据、标准、技术和场景”是数据中心智能化运维体系建设的核心要素,依托服务流程体系和IT连续性体系,利用大数据、人工智能等新技术,实现数据的集中管控。构建以监、管、控、防四大平台为支撑的新一代“服务化、数字化、平台化”的运维服务体系。
数据和标准体系是实现数字化运行态管控的智能运维体系的基石,其中数据治理和数据生产是关键。
数据治理标准:数据作为基础性战略资源,核心价值在于应用,在于其赋值和赋能作用。如何实现数据资源和数据交换共享是数据发挥价值的关键因素,也是数据标准的关键组成部分。
数据生产标准:建立数据中心的运营管理标准,包括技术产品目录、非功能需求标准、操作维护规范,从数据生产源头来保障运营数据的标准化,提升数据质量。
以数据为基础的运维PaaS服务平台构建
数据中心智能化运维不只是利用机器代替人工,也不仅是大数据+自动化,而是利用人工智能技术,充分发掘各项数据资产价值,探索数据中心运营的创新。
我行持续探索智能化运维平台化能力建设,在整体架构上涵盖数据采集、数据处理、服务组件和展示,从数据范围、数据质量、数据应用和数据技术多个维度构建智能化运维数据支撑体系。
数据采集:数据源按业务属性划分为配置数据、运行数据、行为数据。配置数据包括基础环监数据、硬件设备数据、基础软件数据及应用程序数据多个层级;运行数据包括基础设施、硬件设备及应用程序运行过程中产生的数据;行为数据包括生产运行过程中人员维护、自动化维护产生的各类数据。我们围绕数据中心的数字化运行态建设逐步推广采集范围。
数据处理:由于数据的多源异构性,利用大数据技术建立一个运营数据仓库,实现数据中心的数字化运行态画像,建立各类智能化运维场景的能力。
服务组件:建立组件化服务引擎,为具体的应用场景提供机器算法、生物识别等服务组件。
场景应用:应用是结合实际运营业务场景需求,延展数据中心运营管理的深度与广度。如我们正在探索建设的动态基线监控、海量告警压缩、业务容量预测等应用场景。
以“运维PaaS平台框架”为蓝图的服务平台建设
光大银行在“智能化运维”的探索与实践中,以大数据平台为基础,逐步推动光大银行智能运维场景的落地实现,构建新一代监控平台、自动化平台、安全管控平台。
运维大数据平台,依托大数据技术,实现网络流量、交易流量、日志等全面运营数据的实时采集;实现对数据中心的“数字化运行态”画像,建立数据中心级数据管控平台。
统一监控平台,运用Hadoop、Spark等大数据技术在监控领域的应用,对海量生产运行数据的高效分析与处理,实现监控报警的大集中管理,提升监控管理的标准化、自动化能力。
自动化运维平台,以知识共享、赋能理念为基础,建立围绕配置管理的自动化运维平台。实现监、管、控一体化,有效地推动运维工作的标准化、规范化,降低人工操作风险,提高运维服务的质量和效率。
安全管控平台,以防御协同化、分析智能化、响应一体化、流程电子化的统一运营为理念和目标,聚合全行安全态势感知所需的各类信息安全监测、拦截、信息安全管控技术措施产生的运行数据及其他关联性数据,打破各类数据“孤立、无关联”的现状,结合外部安全威胁情报数据,驱动信息安全工作提升到新的阶段,将信息安全风险管理从被动变为主动。
领取专属 10元无门槛券
私享最新 技术干货