匿名 rdbms 数据,保持关键关系

问题描述

是否有一种“随时可用”的方法来匿名化数据,但保持键之间的关系? 例如,我有

  • 表 #1
用户代码 邮政编码
ztxp15 45789

还有:

  • 表 #2
用户代码 订单日期
ztxp15 2021-06-27 06:22pm

我希望将其匿名化为:

用户代码 邮政编码
xvdf65 32165

还有:

  • 表 #2
用户代码 订单日期
xvdf65 2021-06-27 06:22pm

这将需要:一个双射函数,用于转换数据,保持其格式 ([a-z]{4}[0-9]{2}),生成相同的值,例如根据密码短语。 这样,唯一性将被保留,格式也是如此。但也许我错过了一些东西。 我认为这个问题很常见,所以我正在寻找以前的工作。

解决方法

使用用户标识符是一种常见的做法,我本身对查看者没有意义。我假设在您的情况下这是 user code

您应该只对 PII(个人身份信息)进行匿名处理。您可以对其进行双向加密,也可以对其进行散列以进行单向匿名。将数据导出到分析仪表板时通常会进行哈希处理。

匿名化 user code 并不常见。如果所有 PII 都是匿名的,那么 user code 就有效地匿名了。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...