问题描述
是否有一种“随时可用”的方法来匿名化数据,但保持键之间的关系? 例如,我有:
- 表 #1
还有:
- 表 #2
我希望将其匿名化为:
还有:
- 表 #2
这将需要:一个双射函数,用于转换数据,保持其格式 ([a-z]{4}[0-9]{2}),生成相同的值,例如根据密码短语。 这样,唯一性将被保留,格式也是如此。但也许我错过了一些东西。 我认为这个问题很常见,所以我正在寻找以前的工作。
解决方法
使用用户标识符是一种常见的做法,我本身对查看者没有意义。我假设在您的情况下这是 user code
。
您应该只对 PII(个人身份信息)进行匿名处理。您可以对其进行双向加密,也可以对其进行散列以进行单向匿名。将数据导出到分析仪表板时通常会进行哈希处理。
匿名化 user code
并不常见。如果所有 PII 都是匿名的,那么 user code
就有效地匿名了。