前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Data Masking:线上数据线下使用的数据处理方法

Data Masking:线上数据线下使用的数据处理方法

作者头像
Criss@陈磊
发布2024-07-12 16:06:27
1820
发布2024-07-12 16:06:27
举报
文章被收录于专栏:测试技术圈

在信息技术领域,敏感数据是指那些一旦被泄露或滥用,可能会对个人隐私、企业利益或国家安全造成严重影响的信息。这类数据通常包括但不限于: 个人信息:如姓名、身份证号、联系方式、住址等。 财务信息:如银行账户、信用卡号、交易记录等。 商业机密:如产品设计、市场策略、研发资料等。

数据脱敏(DataMasking)就是针对敏感信息进行处理的技术,通过对敏感数据的清晰、变形等方法保护了敏感信息的保密性,同时又能够利用这些信息进行质量保证工作的支持。

数据脱敏的规则

  • 随机化:通过将敏感数据替换为随机值或者伪随机值,保护原始数据的真实性。例如,将身份证替换为随机生成的身份证号码;
  • 掩码:通过将敏感数据的一部分替换为掩码,隐藏部分敏感信息。例如,将电话号码的后6位替换为星号;
  • 加密:通过对敏感数据进行加密,保护数据的机密性。例如,对信用卡号码加密处理,可以通过哈希法将新信用卡号码进行哈希处理,转换成不可逆的哈希值;
  • 截断:通过截断敏感数据的一部分或全部,限制访问敏感信息的范围。例如,只显示姓名的首字母;
  • 虚拟:在测试和开发环境中使用虚拟数据代替真实数据,虚拟数据可以是随机生成的、采样的或者是经过脱敏处理的;
  • 偏移:对于某一些数据进行固定的偏移,例如订单流水实际都是1开头的,那么我们都处理成9开头的。
  • 合成:通过算法生成与真实数据相似但不完全相同的数据。这些数据在统计特性上与原始数据保持一致,但不包含任何可以追溯到个人的信息。例如利用原始数据的统计特性,如均值、方差等,生成新的数据集;使用机器学习模型,如决策树、神经网络等,学习原始数据的模式,并生成新的数据集等等方法。

数据脱敏的流程

数据脱敏

  • 明确脱敏数据范围:了解哪些数据需要脱敏,避免过度脱敏或不足。
  • 选择合适的脱敏规则:根据数据类型和使用场景,选择最合适的脱敏规则。
  • 审查脱敏策略:随着业务发展和技术进步,定期审查和更新脱敏策略。
  • 自动化脱敏过程:利用自动化工具进行数据脱敏,提高效率和准确性。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 质问 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据脱敏的规则
  • 数据脱敏的流程
相关产品与服务
数据脱敏
数据脱敏(Data Masking,DMask)是一款敏感数据脱敏与水印标记工具,可对数据系统中的敏感信息进行脱敏处理并在泄漏时提供追溯依据,为企业数据共享、迁移、分发提供安全保护措施。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档