原创 大厂也在用的 6种 数据脱敏方案,严防泄露数据的 “内鬼”

发布时间:2021-08-02 15:17:11 浏览 7530 来源:猿笔记 作者:程序员内点事

    能做的就是尽量避免经我们手的用户数据泄露?那今天就来讲讲互联网中内部防止隐私数据泄露的手段-**数据脱敏**,先来看看什么是数据脱敏,防止敏感数据直接在不可靠的环境下使用。像政府、医疗行业、金融机构、移动运营商是比较早开始应用数据脱敏的,3数据脱敏又分为静态数据脱敏(`SDM`)和动态数据脱敏(`DDM`),适用于将数据抽取出生产环境脱敏后分发至测试、开发、培训、数据分析等场景。有时我们可能需要将生产环境的数据`copy`到测试、开发库中,但出于安全考虑又不能将敏感数据存储于非生产环境,此时就要把敏感数据从生产环境脱敏完毕之后再在非生产环境使用。


    #主题列表:juejin,github,smartblue,cyanosis,channing-cyan,fancy,hydrogen,condensed-night-purple,greenwillow,v-green,vue-pro,healer-readable

    #投稿主题:

    theme:juejin

    highlight:

    最近好几个晚上总在家里接到一些奇怪的电话,“哥,你是xxx,我们是xxx高端男士的私人俱乐部……”,抱着草,一开始我很震惊,然后狠狠地骂了回去。我一脸自豪的转过头,笑得有点谄媚:亲爱的,听我说,我真的什么都没做,你要相信我!

    啪~

    揉揉脸想了想,肯定是不道德的网站卖了我的个人信息。现在人们在网上处于裸奔状态,个人信息不再属于个人。现在这种事情好像很正常。但是,这些事情大多发生在* *鬼身上。

    作为开发者,我们能做的就是尽量避免用户数据通过我们的手泄露。今天我们就来说说防止互联网隐私数据泄露的内部手段——* *数据脱敏* *。

    # # #什么是数据脱敏

    我们来看看什么是数据脱敏。数据脱敏也叫数据隐私。鉴于脱敏规则和策略,转换或修改`手机号码'和`银行卡号码'等敏感数据是一种技术手段,以防止敏感数据在不可靠的环境中直接使用。

    政府、医疗行业、金融机构、移动运营商相对较早的开始应用数据脱敏,因为他们所拥有的是用户的核心私密数据,如果泄露的后果是不可估量的。

    数据脱敏的应用在我们的生活中相当普遍。比如在淘宝购物订单的明细中,商家的账户信息会被` * '屏蔽,保证了商家的隐私。这是一种数据脱敏的方式。

    数据脱敏分为静态数据脱敏(` SDM ')和动态数据脱敏(` DDM '):

    # # #静态数据脱敏

    静态数据脱敏(` SDM '):适用于从生产环境中提取数据,脱敏并将其分发给测试、开发、培训、数据分析等场景。

    有时,我们可能需要将生产环境的数据复制到测试和开发库中,以解决问题或分析数据。但是,出于安全原因,我们不能在非生产环境中存储敏感数据。此时,在非生产环境中使用敏感数据之前,我们必须对生产环境中的敏感数据进行脱敏。

    这样,脱敏的数据与生产环境隔离,满足了业务需求,保证了生产数据的安全。

    如上图所示,用户真实的“姓名”、“手机号码”、“身份证”、“银行卡号码”通过“替换”、“失效”、“无序”、“对称加密”脱敏。

    # # #动态数据脱敏

    动态数据脱敏(` DDM '):一般在生产环境中使用,在访问敏感数据时实时进行脱敏,因为有时候在不同的情况下读取相同的敏感数据需要不同级别的脱敏处理,比如不同的角色、不同的权限会实施不同的脱敏方案。

    * *注* *:在擦除数据中敏感内容的同时,还需要保持原有的数据特征、业务规则和数据相关性,以保证我们的开发、测试和数据分析业务不会受到脱敏的影响,使脱敏前后的数据一致有效。* *一句话:你爱怎么脱就怎么脱,别影响我用就好。

    # # #数据脱敏方案

    数据脱敏系统可以根据不同的业务场景定义和编写脱敏规则,可以对数据脱敏,而不需要登陆数据库表中的某个敏感字段。

    数据脱敏的方法有很多。接下来,将基于下图中的数据逐一演示每个方案。

    ####1.失效

    在对待脱敏数据进行处理时,失效方案通过“截断”、“加密”、“隐藏”等方式对敏感数据进行脱敏,使其不再具有使用价值。一般特殊字符(` * `)等。)来代替真值。这种隐藏敏感数据的方法很简单,但缺点是用户无法知道原始数据的格式。如果您想获得完整的信息,您应该授权用户进行查询。

    比如我们把身份证号换成*,就会变成“220724******3523”,很简单。

    ####2,随机值

    随机值替换,字母变成随机字母,数字变成随机数字,单词随机替换单词改变敏感数据。这种方案的优点是可以在一定程度上保留原有的数据格式,用户往往察觉不到。

    我们可以看到,`姓名'和`身份证号'字段已经随机化和脱敏,而名、姓、姓的随机化有点特殊,需要有相应的姓氏字典数据支持。

    ####3,数据替换

    数据替换类似于之前的失效方法,只是没有被特殊字符阻挡,而是用设定的虚值替换真值。例如,我们将手机号码设置为" "。

    ####4,对称加密

    对称加密是一种特殊的可逆脱敏方法

作者信息

程序员内点事 [等级:3] 公众号:程序员内点事
发布了 67 篇专栏 · 获得点赞 5059 · 获得阅读 332382

相关推荐 更多