企业大数据数据源接入越来越多、数据量越来越大、平台越来越复杂,保存了很多企业敏感数据,甚至客户隐私信息。随着数据商业价值的增加,针对数据的攻击、窃取、滥用、泄露等活动的持续泛滥,企业面临着严峻的安全风险。
安全风险及事件存在以下特点:一、风险成因复杂交织,既有外部攻击,也有内部泄露,既有技术漏洞,也有管理缺陷;既有新技术新模式触发的新风险,也有传统安全问题的持续触发;二、威胁范围全域覆盖,大数据安全威胁渗透在数据生产、交互和消费等大数据产业链的各个环节,包括数据源的提供者、大数据加工平台的提供者以及大数据分析服务的提供者等各类主体;三、事件影响重大深远,数据泄露影响面广,对用户隐私造成极大损害。从企业角度,建议运营者规范数据开发利用规则明确数据权属关系,重点加强个人数据和重点数据的安全管理,针对采集、存储、传输、处理、交换和销毁等各个环节开展全生命周期的保护,从制度流程、人员能力、组织建设和技术工具等方面加强数据安全能力建设。
安全防护体系的建设需要遵循“三分技术七分管理”的安全防护理念,从技术层面上考虑物理设施的安全,终端安全、网络安全和云平台安全等方面。平台安全管理要强化数据权限控制、数据脱敏和隐私保护和数据可信赖管理。横向涵盖数据流向各环节、纵向平台架构分层进行防护,规划和设计从网络、平台、数据、管理等方面全方位考虑安全防护,构建安全防御体系。
整体架构上横向主要是在数据采集入口增加安全网关、防火墙防护;建立数据安全隔离区,集中进行数据对内外交互、数据出口侧增加数据防泄漏设备,在交互过程对数据进行授权、隐私保护、水印、加密传递等处理。纵向从大数据平台硬件资源层加强漏洞检测版本补丁更新、Hadoop组件进行安全基线扫描。数据层面:管理上对数据进行敏感等级分类、安全保护机、操作规范制定,根据规则对现有数据进行脱敏处理;应用租户,可通过4A等安全平台进行授权及合规操作等。
网络安全:
一、内外网物理隔离:大数据平台部署在企业内网,与外网物理隔离杜绝安全隐患。对网络通讯进行监控,如果发现任何来自于网络内部或外部的黑客入侵或可疑的访问行为,可做到及时的报警与阻断,通过网络平面隔离的方式来保证网络安全。
二、数据采集安全防护:对内对外系统数据采集网络入口部署防火墙、安全网关,建立数据隔离区,完成大数据平台内外部系统数据交互,保障安全。
三、数据共享安全防护;多租户隔离,实施多租户访问隔离,数据安全等级划分以及基于标签的强制访问控制,提供数据访问授权模型,提供全局数据视图和私有数据视图,提供数据视图的访问控制。通过数据隔离区,实现大数据平台数据对企业内外部数据共享,在网络出口处部署数据防泄漏设备,实现敏感数据保护。
四、数据传输安全防护:用户隐私数据脱敏,提供数据脱敏和个人信息去标识化功能,提供满足国际密码算法的用户数据加密服务。各类用户可通过数据共享发布平台访问大数据平台,提交访问数据请求,访问代理层收到用户访问请求后,根据用户权限分析所要访问的数据,与脱敏及访问策略映射库进行比对,对需要脱敏的数据进行脱敏然后加密传输展示给用户。
五、流量异常监控:搭建数据流量异常监控平台,能够实时监控平台出现的各种网络问题。对网络中所有传输的数据进行检测、分析、诊断,排除网络事故,规避安全风险,有效的提高网络性能。
六、数据容灾:为集群内部数据提供实时的异地数据备份容灾功能,数据库对外提供跨数据中心的容灾机制。
平台安全:
一、硬件安全:主机安全漏洞扫描,系统版本补丁更新,防病毒处理等。加强主机口令、操作管理,减少非法登录。定期备份系统和文件数据,能够快速修复主机的系统问题。建设大数据系统的网关/防火墙,外部攻击首先需要冲破代理的保护才能进一步攻击大数据平台,增加恶意用户的攻击难度。
二、组件安全:组件安全针对大数据的主流平台HDFS、HIVE、HBASE、Storm、Spark等进行安全基线扫描,分别提出身份、认证、授权、审计等配置方面检查方法,并形成可操作的手册和可执行脚本,并整合入SMP系统管理;增加对大数据平台漏洞信息的管理及处理。
三、存储安全:存储安全包括数据的加密存储、访问控制、数据的封装、数据的备份与恢复以及残余数据的销毁。敏感数据脱敏保存,禁止明文存储。加强数据文件的校验,保持分布式文件的一致性。根据安全要求,授权访问数据。定期备份数据,一旦发生数据丢失或损坏,可以利用备份来恢复数据,从而保证在故障发生后数据不丢失。
四、应用安全:用户认证,多租户纳入4A平台集中管理,接入4A平台管控的大数据平台必须开启Kerberos认证配置,以集中管控大数据平台的多租户信息。金库访问:当多租户没有明文数据的查询权限,经审批可以通过金库模块获得明文数据的查看权限。
数据安全:对数据进行敏感等级分类、安全保护机及操作规范制定。根据敏感数据规则定义对平台存储敏感数据识别、打标及打标数据的分类分级访问控制;根据数据敏感规则,扫描引擎、扫描数据库敏感数据,生成敏感数据及访问策略映射库。
管理保障:建立大数据安全管理保障制度和规范,安全策略管控方面做到集中管理、集中修订、集中更新安全规则,从而实现统一的安全策略实施,安全管理员能够在中央控制端进行全系统的监控;安全保障要求方面按照规范要求进行数据访问、应用操作。相关制度包括对外合作安全管理(外部业务合作和外部代维代建)、内部安全管理、数据分类分级管理、应急响应机制、资产设施保护和认证授权管理等。
大数据安全防护体系的建设,需要对大数据安全防护体系内部的各个模块进行详细的研究,通过多种手段保障企业级大数据平台的安全,最终构建大数据安全管控平台,实现敏感数据隐私保护,降低企业运营风险;规范大数据平台操作流程,保证开源系统的安全,做到大数据平台系统“事前可管、事中可控、事后可查”。
领取专属 10元无门槛券
私享最新 技术干货