一些研究需要敏感的数据集,如学校营养午餐与学生健康的关系、企业薪酬股权激励新手如何开户注册等。这些有价值的数据通常涉及隐私信息。经过多年的努力,谷歌密码学家和数据科学家提出了一项新技术来实现这一目标“多方计算”(multiparty computation),而不是向任何无关的人披露信息。

谷歌将发布一个名字“Private Join and Compute”开源加密工具可以快速连接不同数据集的数字列信息,计算数据的总和、计数或平均值,但只能通过解密查看计算结果——这意味着你可能只能得到结果,而计算过程中的数据是的数据。
事实上,“Private Join and Compute”开源加密工具的原理可以追溯到20世纪70年代和90年代,但谷歌已经重用和更新了技术,以便与更强大、更灵活的处理器。
阿曼达·沃克(Amanda Walker)表示:
“最终的结果是,谷歌可以在不暴露任何个人数据的情况下进行计算,然后只获得汇总结果。实现这一目标的原始方法是获取两个敏感的数据集,将其存储到数据库中,然后连接和总结,但如果将所有内容放在一起,则可能面临数据泄露的风险。”
以学校午餐为例,学校提供所有关于学生和食物储存时间的信息,但随着时间的推移,新手需要使用健康服务提供商的数据来跟踪菜单的变化是否可能对学生的健康产生积极影响。“Private Join and Compute”开源加密工具允许各方持有非常敏感的数据,但敏感信息不会相互泄露。
“Private Join and Compute”20世纪70年代使用开源加密工具“交换加密”(commutative encryption)该技术允许在不考虑密钥使用顺序的情况下,使用多个密钥对数据集中的数据进行加密。该技术有助于用户需要应用和剥离多层加密,但不会影响加密数据执行的计算。更重要的是,“Private Join and Compute”开源加密工具还结合了20世纪90年代的一些加密方法,使系统结合两个加密数据集来确定它们的共同点,然后被称为“同态加密”(homomorphic encryption)该技术直接计算加密和不可读数据。
阿曼达·沃克补充说:
“我们发现早期的系统非常有限,只有一部分操作,所以谷歌正在考虑是否可以优化这些加密操作,答案当然是肯定的。”
谷歌已经发表了一篇关于技术论文的描述“Private Join and Compute”学术和行业的加密用户如何使用开源加密工具。由于谷歌正在开源,未来将有更多的机会审查工具的安全性和隐私。
泰尔·马尔金(Tal Malkin)他是哥伦比亚大学的密码学家,他说他很早就读过这篇论文,并认为这个新工具代表了加密行业向前迈出的重要一步,因为它来自谷歌,而且是开源的。这可能会鼓励那些充满用户数据并希望管理数据隐私的公司使用谷歌的加密工具。
泰尔·马尔金说:
“自二十世纪80年代以来,安全计算一直是密码学重点研究的领域,但直到最近才被业内认为是一种专业的理论研究。我认为,令人兴奋的是,谷歌希望开放这一重要的隐私技术。”
事实上,包括谷歌在内的许多企业都希望使用它“Private Join and Compute”开源加密工具研究私人数据,不超出隐私范围。
