隐私保护学习笔记

起因

随着大数据、云计算和移动互联网的快速发展和广泛应用,医疗数据面临严峻的隐私泄露问题,如患者个人信息(身份、家庭、工作等)、采集的病征信息(如脑电、影像等)、以及电子病历信息等。

隐私保护的必要性

最近关于互联网隐私引发大众的关注于讨论,前有Facebook“数据门”,小扎不得不换下常穿的灰色短袖和牛仔装,换上深蓝色西装参加国会听证;后有百度总裁李彦宏称中国用户愿用隐私方便和效率引发网友强烈反感,网友评论说,牺牲隐私不一定换来效率,还可能换来死亡,比如搜索到莆田医院,还可能换来经济损失,比如大数据杀熟等等;近来有知乎强制隐私搜集条款,引发部分用户卸载APP,国内很多APP若不同意给予相关权限,则无法正常使用,这真是陷入两难境地。为什么现在很多应用会收集数据呢,《未来简史》这本书中给了答案——未来的世界数据为王,人类可能只是放大版的蚂蚁,用于产生数据。有了数据后,加上合适的算法可以完成很多事情,这些技术均与机器学习、深度学习以及数据科学相关。人们担心自己的数据被收集后会被泄露或者是被不正当使用,因此,如何将隐私数据很好地保护起来是公司需要考虑的主要问题之一。

隐私保护面临的挑战

  1. 传统的被动式隐私保护技术,存储和计算的外包使得数据生成者失去对数据的知情权和控制权。

  2. 大数据的多样性带来的多源数据融合,增加隐私泄露的风险。

  3. 缺乏大数据隐私泄露后相应的补救措施。

  4. 个人隐私和数据的法律法规淡薄。

主要的隐私保护技术

  1. 数据扰动

静态数据发布的匿名模型(如k-匿名)

动态数据发布的隐私模型(如差分隐私)

  1. 基于密码学的隐私保护

数据加密:同态加密、安全多方计算

  1. 数据隐藏

数字水印

  1. 数据使用

身份认证、访问控制、安全审计等

隐私保护技术详细介绍

  1. 数据匿名化技术

在数据发布时根据某些限制不发布数据的某些域值,方法有泛化、隐匿、交换等,其中,泛化和隐匿最为常用。应用:数据脱敏,数据发布。

泛化:用更一般的值或者模糊的值取代原始属性值,但语义上与原始值保持一致

隐匿:用最一般化的值取代原始属性值,可视为是最高级别的泛化。

匿名化模型:k-匿名、l-多样性、 t-Closeness、个性化匿名、动态数据匿名化。

  1. 差分隐私

差分隐私(Differential privacy)是一种被广泛认可的隐私保护模型,它通过对数据添加干扰噪声的方式保护发布数据中潜在用户的隐私信息,从而达到即便攻击者已经掌握了除某一条信息以外的其它信息,仍然无法推测出这条信息。

保证任意一个体在数据集中或者不在数据集中时,对最终发布的查询结果几乎没有影响.具体地说,设有两个几乎完全相同的数据集(两者的区别仅在于一个记录不同),分别对这两个数据集进行查询访问,同一查询在两个数据集上产生同一结果的概率的比值接近于1.

差分隐私保护可以通过在查询函数的返回值中加入适量的干扰噪声来实现,常用的技术为拉普拉斯机制、指数机制。

  1. 同态加密

同态加密,能够在不解密的情况下对密文数据进行计算,使得对该密文的明文执行了相应的计算。解决了密文域的安全计算问题。

根据密文计算能力的不同,可以分类为单同态加密、类同态加密、全同态加密。

  1. 安全多方计算

解决一组互不信任的参与方之间保护隐私的协同计算问题,SMC要确保输入的独立性、计算的正确性、去中心化等特征,同时不泄露各输入值给参与计算的其他成员。

主要是针对无可信第三方的情况下,如何安全地计算一个约定函数的问题,同时要求每个参与主体除了计算结果外不能得到其他实体任何的输入信息。

  1. 数字水印

将一些标识信息(即数字水印)直接嵌入数字载体(包括多媒体、文档、软件等)当中,但不影响原载体的使用价值,也不容易被人的知觉系统(如视觉或者听觉系统)觉察或注意到。包括图像水印、音频水印、视频水印、文本水印。

应用:版权保护、数字指纹、认证和完整性校验、内容标识和隐藏标识、内容保护、隐蔽通信。

  1. 身份认证

分类

1)根据客观的认证条件,分为双因子与单因子两种不同的认证方式;

2)借助于认证信息的分类,可以分为动态的和静态的认证;

3)从运用硬件还是软件角度,分为软件与硬件两种不同的认证。

身份认证方式:

1)生物特征认证,缺乏准确性和稳定性、成本高;

2)用户名和密码,静态密码、密码容易暴露;

3)USB Key认证,客户端的缺陷、冲击-响应认证不能进行双向认证;

4)动态口令/动态密码,单密钥、成本高。

https://blog.csdn.net/yunqiinsight/article/details/80177749
https://zhuanlan.zhihu.com/p/478367669

相关文章

显卡天梯图2024最新版,显卡是电脑进行图形处理的重要设备,...
初始化电脑时出现问题怎么办,可以使用win系统的安装介质,连...
todesk远程开机怎么设置,两台电脑要在同一局域网内,然后需...
油猴谷歌插件怎么安装,可以通过谷歌应用商店进行安装,需要...
虚拟内存这个名词想必很多人都听说过,我们在使用电脑的时候...