什么是数据匿名化
数据匿名化旨在通过从数据库中删除或加密个人身份信息来保护私有或敏感数据。 进行数据匿名化的目的是保护个人或公司的私人活动,同时保持收集和共享的数据的完整性。 数据匿名化也称为“数据混淆”,“数据屏蔽”或“数据去标识”。
分解数据匿名化
公司在正常的业务运营过程中会生成,存储和处理大量敏感数据。 由于在各个部门和国家之间生成并共享的数据中找到了相关信息,因此技术的发展蓬勃发展。 借助社交媒体和电子商务机构等部门共享的数据,技术领域的金融创新(fintech)在为客户定制金融服务的方式上取得了无穷的进步。 数字媒体和电子商务公司之间共享的数据已帮助两个部门更好地在其站点上向特定用户或消费者宣传产品。 但是,为了使共享数据有用而又不损害在数据库中编译的客户端的身份,必须使用匿名化。
实践中的数据匿名化
大多数处理敏感信息的行业(例如医疗保健,金融和数字媒体行业)都在进行数据匿名化,同时促进数据共享的完整性。 数据匿名化可减少在同一公司的国家,行业甚至部门之间共享数据时意外泄露的风险。 例如,如果一家医院将其患者的机密数据共享给医学研究实验室或制药公司,则它可以在道德上做到这一点,只要它使患者保持匿名。 这可以通过从共享列表中删除其患者的姓名,社会安全号码,出生日期和地址来完成,同时保留医学研究所需的重要组成部分,例如年龄,疾病,身高,体重,性别,种族等。
数据匿名化技术
数据匿名化可以通过多种方式完成,包括删除,加密,泛化以及其他多种方式。 公司可以从收集的数据中删除个人身份信息(PII),也可以使用强大的密码短语对该信息进行加密。 企业还可以决定对数据库中收集的信息进行概括。 例如,一张表包含了零售部门中五位首席执行官的确切总收入。 假设记录的收入是$ 520, 000,$ 230, 000,$ 109, 000,$ 875, 000和$ 124, 000。 此信息可以归纳为“ <$ 500, 000”和“≥$ 500, 000”之类的类别。 尽管数据被混淆了,但对用户仍然有用。
数据匿名化推理
数据匿名化是指对机密信息进行清理和屏蔽,以确保在发生泄露时,所获取的数据对罪犯无用。 每个组织都应高度重视保护数据的需要,因为落入错误手中的机密信息可能会被有意或无意地滥用。 由于监管机构严厉打击重大过失,处理敏感的客户信息时缺乏敏感性会给企业带来巨大的损失。 诸如PCI DSS(支付卡行业数据安全标准)之类的法律和合规性要求在发生信用卡违规事件时对金融机构处以高额罚款。 PIPEDA(加拿大法律)管辖公司对个人信息的披露和使用。 还成立了其他多个监管机构来监视组织对私人数据的使用或滥用。
可以通过称为反匿名化(或“重新识别”)的过程来解码匿名数据。 由于匿名数据可以被解码和解散,因此批评家认为匿名提供了一种错误的安全感。