如何通过隐私计算为数据确权和定价?
前言:
当前隐私计算面临什么样的机遇和挑战?如何应对可能的政策风险?在隐私数据的生命周期当中应当包含销毁数据的过程。在上链之后,又要如何对数据进行销毁?近日,PlatON首席技术官曲俊杰应邀与链得得展开对话,从技术与商业角度解读隐私计算。
以下为对话精选实录,以飨读者:
1
主持人:在全球各国都开始对数据隐私进行更加严厉的监管的背景下,数据提供方获取数据、保存数据成本都会极大地提高,而保障数据的更正权和被遗忘权则需要更多的人工和时间成本。对于数据的利用方来说,使用范围、使用方式都被限制在了很小的范围内,更不论GDPR对其提出的匿名化、加密化的成本提升。这里就出现了一个矛盾。明文大数据分析会导致隐私泄露,大规模数据密态化又影响分析效率。这个矛盾如何解决?
曲俊杰:明文数据可以被随意复制、存储、传播、利用,因为隐私泄露造成的危害可能是长远的,在此不再赘述。
数据的隐私计算虽然有多种多样的形式,根据不同的算法实现,理论上计算复杂度和网络通信复杂度的增加是必然的,从而也导致了分析效率的显著降低。针对如何在保证数据可用不可见、甚至不可离开本地等不同的保护要求,我们通过算法研究团队的攻坚优化、工程实现团队的深度实现优化、再加上硬件加速等诸多手段,根据不同场景选择适配的算法,场景解耦后在不同阶段适配不同算法、以及在同一阶段解耦可并行计算等来达到商用的水平。
另外,从大趋势上,网络传输速度和硬件计算能力的不断提高也有助于隐私大数据AI的商用落地。
2
主持人:在隐私数据的生命周期当中应当包含销毁数据的过程。区块链作为去中心化的系统,上链数据无法修改和删除。那么利用区块链的隐私计算系统当中,在数据上链之后,如何进行销毁?
曲俊杰:欧洲的GDPR对数据权益做了相对严格的定义,里面提到了「被遗忘权」。也就是数据的彻底销毁。GDPR也正在修订争议之中。
首先明确一点,PlatON的隐私计算网络是在PlatON区块链之上的,只把可验证隐私计算结果上链,在链上做自动清结算。选择什么数据上链是区块链生态系统生命攸关的问题,大量隐私数据上链可能导致区块链存储和效率问题,同时也不是基于MPC隐私计算的选项,因为数据离开了本地。
假设我们的确需要把少量隐私保护(非MPC类)数据做链上存储,区块链的特质是在数学算法保护下一旦上链保存就不可销毁、不可篡改,的确和「被遗忘权」是相悖的。然而仔细分析下来,「被遗忘权」的真实含义是数据的内容永远不可见、从而「被遗忘」,反而只有隐私保护的数据可以做到这一点,而明文数据是无法做到的。
换句话说,只要把隐私数据的私钥,通过可验证的方式保证销毁,那么隐私数据可以在理论上等同于「被遗忘」了。
那么,做到对「数据进行销毁」的前提就是,根据数据集合的颗粒度,每个被赋予独立的「被遗忘权」的数据集合有各自独立的私钥,数据集合在隐私保护后上链,以及私钥的可验证销毁机制。所以刚才我也强调了可验证的销毁,这需要非常灵活的解决方案,我们是希望技术社区贡献各种各样的场景,让我们能够去了解这些场景、真正地理解这个需求。
3
主持人:基于区块链的隐私计算如何适应不同的隐私数据安全场景?如何保证对不同行业和企业提供个性化的隐私计算服务?
曲俊杰: 大家现在对隐私计算的概念理解还是有区别的。这方面需要充分的沟通,所以个性化是个非常现实的问题。数据的隐私计算是个突飞猛进的新兴行业,就像我们自己对数据的隐私需要逐步理解到提出需求一样,众多行业对数据隐私还停留在需求阶段。我们经过多年深度研究,储备了各类不同的隐私算法,但是不同场景、数据量不同、数据格式不同、法律法规不同,根据场景分析,适配各种算法是我们的强项。
比如我们为银行提供的隐私计算解决方案就是充分个性化的。
4
主持人:那么您认为区块链在隐私计算行业中的位置是什么?
曲俊杰:区块链和隐私计算是两个不同维度的东西,它们的基础属性不同,区块链是为了信任,隐私计算是为了隐私。需要保护的数据是正在形成隐私计算行业的核心。如何做到可信的数据采集、归集、整理、存储、计算等等是区块链可以起到核心作用的地方。
以PlatON为例,PlatON是隐私计算网络+分布式经济体基础设施。这两者其实保持了各自的相对独立,但目前有很多将区块链理解为隐私计算是不对的。
在隐私计算方向PlatON主要锁定在为数据进行确权和定价这个核心需求,通过隐私AI来解决目前在金融、医疗、广告等多个领域对于数据共享和协同计算存在着的强烈需求。
所以这两个问题实际上是相辅相成的,不能只看重隐私,却忽视了数据权益。只有区块链却没有隐私又会限制技术的应用范围。
5
主持人:您之前也提到了个性化服务是个现实的问题。在这些领域PlatON是怎么做的?能分享一些案例吗?
曲俊杰:我们在个性化服务方面,往往面对的是一个崭新的领域,我们首先要坐下来分析客户的业务,分析法律法规对数据的要求:哪些是可以公开的数据,哪些是必须保护的数据,又要保护到什么程度。对这些问题进行彻底的分析之后数据进行结构化处理,以适配我们的算法库。
我们与银行合作的案例包括信用、黑白名单,这种案例中的数据都非常有特色,所以我们应用了很多密码学的算法,对数据进行充分的解构、打包、重新组合。
另外制药这一类生命科学相关的数据就是另外一种数据,比如说DNA数据,采取不同的算法才能够真正商用。
6
主持人:隐私计算目前面临什么样的机遇和挑战?如何应对可能的政策风险?
曲俊杰:随着各个数据生产主体,包括个人的数据权益意识的觉醒,各个权力机构也随之推出相应的隐私保护法律法规。只是这些法律法规仍然落后于当下技术的突飞猛进。
大数据,超级AI的出现和广泛应用,加上我们已经被大量IoT智能设备包围,隐私侵害问题已经是全世界广泛面临、越来越严重的问题。其背后是数据权益的梳理问题。映射到数字世界,这些数据对人类的数字生命做了精准描绘,大家会发现系统比自己了解自己,人的行为已经在不知不觉中被算法诱导,形成共生状态。人类及其衍生的商业活动已经不得不面临大数据AI用户画像算法的挑战,这也造就了活在系统中的人(比如前些日子的快递员悲剧),比如315发布的数据被盗用等社会问题。
虚假数据损害信誉,盗用生物特征、比如人脸数据可以造成的侵害可能是毁灭性的。设想一下被盗的人脸等数据没有保护地游离在互联网上,被反复复制存储,未来一旦和超级AI结合起来,物理世界个体的生存主权会被严重侵犯。每想到这里我是毛骨悚然的。
隐私计算技术的核心是面向数据的流动,让数据可用而不可见,大数据和AI是天然的载体,我们提供的解决方案已经涵盖金融、医疗、零售、互联网等多个行业。当下是个历史性的机遇。
那么PlatON是如何做的呢?PlatON的隐私计算将通过对数据的保护,保护之后产生的数据权益的保护, 隐私计算保护之下数据孤岛的链接,促进数据的流动、从而产生价值,以及价值的合理分配机制来改良现状,促进社会进步。
挑战也是多方面的,对数据场景的把控、分析,对隐私算法的商用级优化等等。还有法律法规对隐私计算复杂度考虑不足造成的法律法规缺位和错位。这些建议通过沙盒来实现功能的同时,教育社区并把经验分享给法律制定者。
7
主持人:既然提到了监管,那么隐私计算是一门合规化的生意吗?更高的监管压力是否意味着更大的市场前景?
曲俊杰:隐私计算作为崭新的行业,我谈一些个人想法。
我基本上同意监管压力与市场前景的正比关系。隐私计算是新生数据生意的护航技术,可以说没有隐私计算很多数据生意无法合规落地。
随着万物互联、各种行为和商业活动的进一步数据化,法律法规的一步一步跟进,基于隐私AI的新的数据市场的不断衍生,数据市场的规模将远大于现在传统市场的规模,前景非常广阔。我个人非常看好。
8
主持人:那么您对我国未来的数据隐私监管有什么样的看法?是否会在近期收紧对隐私数据的监管?
曲俊杰:隐私数据的范畴需要给出一个贴切的定义。不太好回答,个人预计近期会加强基于《民法典》的隐私数据监管。
因为数据具有极强的可复制、可加工、可携带等各种特质,而隐私计算技术相对复杂,应用的不好会导致商务上不可用。所以整个监管也会在「松」和「紧」之间摇摆一段时间。
强力建议建立一些不同行业的「沙盒」,权衡发展与监管的矛盾,从实践里提炼出方案。
9
主持人:目前市场上其实有不少团队在做隐私计算。在技术层面,PlatON相比竞品的优势是什么?
曲俊杰:隐私计算基于密码学,其技术也包括很多种,如ZK(零知识证明)、MPC、HE、TEE(可信硬件)等。相比于ZK和MPC,TEE更侧重于安全技术,而且对技术实现和厂商的依赖程度比较高。相比之下,信任成本更低的是依托密码学的ZK和MPC,而其中ZK更侧重于进行「验证式」的计算,是计算的终点;MPC则是解决数据计算的本身,是计算发起的起点。
PlatON在MPC和ZK两方面都有持续投入,从实际业务角度出发,现阶段更多的需求是来自于受限于数据隐私而无法达成计算,那么MPC刚好可以解决这个痛点。ZK其实也是非常关重要的隐私计算技术,通常会用于解决计算正确性问题,属于下一阶段的关键技术。
其实PlatON并没有局限于MPC或者ZK,就像创世白皮书中写的可验证计算或者同态加密,都属于隐私计算的大范畴。
PlatON拥有业界领先的密码学研发团队,汇集了包括中科院、上海交通大学、武汉大学、美国马里兰大学、西北大学等国内外知名高校的著名密码学教授和研究学者。
同时,PlatON长期专注于密码学和隐私计算研究,大力支持密码学相关的学术和技术赛事活动,是密码学领域三大顶级会议Crypto/Eurocrypt/Asiacrypt,和安全领域顶级会议ACM CCS的持续赞助商,同时还作为主要赞助商与国内顶级高校和科研机构一起连续举办了两届密码学冬令营(Crypto Innovation School),分别针对安全多方计算和格密码展开了主题培训。此外,PlatON还独立举办了CISC 2019 密码学年度赛事,旨在鼓励和推广全球密码学方面的创造性的密码学技术作品。
从我们通过以太坊Grants,贡献的MPC技术可见一斑。
10
主持人:最近PlatON有一些大动作,能和大家说说具体情况吗?之后的路线图和长期规划能否透露?
曲俊杰:是的,我们最近的大动作是主网和隐私计算网络上线。PlatON的长期的战略是一直坚定不变的,从最开始最早的白皮书就一直很有定力,一直在坚持做。中期路线图,我们有各个委员会在定期地论证,有社区工作小组的积极参与,我们从社区收集反馈,在长期战略不变的前提下调整战术,不断优化。
我个人认为,区块链的发展,因为开源,你总是很容易地站在巨人的肩膀上继续往前创新,所以它的迭代速度非同一般,感觉我在这儿呆了这几年,相当于以前在传统金融机构干十年。
从长远来讲,我们的密码学团队是非常强的,从科研到工程落地都很有经验,所以我们会持续推出各种层次的隐私计算的协议。
而这些协议的推出,也需要社区给我们一些反馈,无论批评或者是赞同。我们将持续从这些协议里抽象出更基础的协议,下沉到我们的PlatON隐私计算网络,作为一个基础设施做出来。
微信掃描關注公眾號,及時掌握新動向
2.本文版權歸屬原作所有,僅代表作者本人觀點,不代表比特範的觀點或立場
2.本文版權歸屬原作所有,僅代表作者本人觀點,不代表比特範的觀點或立場