问题描述
我希望与一组数据科学家共享一个数据集(主要是时间序列数据),以探索数据内(例如变量之间)的统计关系。但是,出于机密性原因,我无法共享原始数据集,因此我想知道是否可以使用我知道但接收者无法进行的一些随机转换来转换数据。这是常见的做法吗?有相关的R包吗?
我一直在探索合成数据集的使用,并研究了“ synthpop”,但是我面临的挑战似乎略有不同。例如,我并不一定希望数据包含与原始文件相似的虚构人物。相反,我希望与特定变量关联的值对于人类观看者来说尚不清楚(例如,仍然是数字,但也没有意义),但仍可以进行统计分析(例如,尽管实际值不清楚,变量“ x”和“ y'保持不变)。
我觉得这可能是一个非常简单的过程(例如,更改变量的名称,对所有变量应用相同的转换),但是我不是数学家/统计学家,所以我不想违反基础知识。通过不适当的转换建立关系。
谢谢!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)