隐私计算大爆发前夜,如何把握商机?
12月5日,2020世界区块链大会·武汉正式在武汉国际会展中心开幕。大会由巴比特主办,并得到了武汉市政府、江汉区政府、武汉市经信局、中国信通院等部门单位的大力支持。
在当天下午举办的“联邦学习与隐私计算区块链的商业创新发展应用”圆桌论坛,蓝象智联CEO徐敏、洞见科技创始人、董事长姚明、微众银行系统架构师曾纪策、光之树副总裁武姗姗以及富数科技产品总监林琳,共同探讨联邦学习和隐私计算区块链的商业创新。
如何看待数据商业化和隐私之间的博弈和平衡?
徐敏:
数据商业价值和隐私在今天来看似乎是一对矛盾体,但就像两朵面对面冲来的海浪一样,不管这两朵海浪看上去是多么地冲突,在下一秒它们就会融为一体,有共同的前进方向。人类社会的很多矛盾冲突也是类似的,所以我坚信数据商业价值和隐私保护这对矛盾体一定会和谐一致地往前走,这个转变过程中,会需要人文、法律、科技三方面的配套,人文方面,我们需要在享受社会便利和隐私保护之间找到新的平衡点;法律方面,会需要来设定底线;人文和法律结合起来,人文设定上限、法律决定底线,之后就通过技术的发展来优化这个过程,达成更好的平衡态。今天我们牺牲了40%的隐私,实现了60%的个人的便利性,有了隐私计算保护以后,我们只需要牺牲更少的个人隐私,就可以换取更多的个人便利性。
如何在数据隐私保护的前提下把握智能数据与区块链融合?
姚明:
先从信用本身讲起,信用行业是比较特殊的行业,行业的本质其实是在利用数据和人的历史经验,也就是模型和智慧去判断交易主体的风险。在这样一个领域存在第三方的信用评估场景,这个场景里面有个非常重要的原则,就是最少可用原则,如果大家关注信用产业的话,这个词是在政策法规中频繁提到的。最少可用的原则其实是为了保护主体的隐私能够不被泄漏,并且不被侵犯,这在今年的民法典里面也有所体现。另一部分也是为了保障公平性。对于最少可用,实际上来说它实现的对于信息的可见部分尽可能不让它去泄漏出来或者被转售。对于这个最小可用原则,如果我们将它定义为是对可见的信息部分的一个保护,现在技术就提供了一个更新的机会,对于那些不可见的计算价值部分,如果我们能够将它抽取出来,是不是就可以打破这个最少可用的原则呢,这点就对于信用评价,特别是风控有重大的意义。
因为从风控的角度来说,它其实并不希望用最小可用原则,他希望用更多的数据来刻划交易对象的风险,以此来进行信用的量化定价和控制风险,这两者实际上是冲突的。那么这种冲突就给联邦学习和多方安全计算提供了机会,对于数据,把它用于计算的价值,从它的可见信息部分抽离出来,让这个不可见的计算价值部分尽可能多的去参与共享,参与流通,参与信用评价,这样就可以从技术层面突破最少可用原则,但是又充分保护了可见的个人隐私信息部分并没有被侵犯或者被泄漏,这个实际上是对信用产业一种技术的革新。
如何对整个系统做安全验证?
曾纪策:
从数据交换或者隐私计算的原理来说,安全验证需要各种算法的证明、一些证书等等。从系统层面来说,比如系统经过安全的认证,3A、4A的安全认证,包括合作方的身份,还有授权,还有账号,还有审计。另外还有一个很大的杀手锏,因为微众银行是完全基于开源的一套东西,我们整个开源产品的家族,包括在线推理、一键可溯化的建模即将推出,也会跟区块链技术结合。我们不单单想在学术界去建立一些标准,我们也尝试通过开源的手段,在工业界建立一些标准。前面几点只是说我们在前面做了一些手段,事后我们还继续提供可审计,包括我们会提供一些网络抓包的方式,还有日志,我们会利用区块链对整个合作过程中的一些行为追溯。
如何突破传统的数据合作模式,实现新型数据可用不可见的联合建模和价值共享?
武姗姗:
传统的数据开放的模式的有几个挑战,其一是数据的所有权和使用权无法进行分离。大家都认为数据放在一起进行计算,建模,开发以及去做相应的分析效果是最好的,但通常对拥有珍贵的数据资产的企业,他们很难去做数据开放的原因是,在传统的计算范式当中,数据发出去后,对方不会对数据反复付费,数据也会脱离数据所有权的人的控制,从而导致用途没有办法明确和监管;其二原来联合建模的模式把数据通过脱敏和据标签化输出,数据标签化主要还是对数据做一个降维,把它变成一个仍然还含有信息,但是维度和细节进行了简化的方式,这样距离真实的业务场景需求就会很远,使用方经常会反馈说给的标签不准,是否能定制标签和开放更底层的数据。因此传统方法无法解决数据融合中的安全、成本和效率问题。联邦学习作为一种全新的技术架构,可以在物理分散,逻辑集中的前提下,让各个数据所有方各自在本地拥有自己的数据,在整个计算和建模的过程中,不需要互相暴露原始数据,并且可以去规定数据的用途和权限,整个数据流转过程做到数据的可用不可见。
隐私计算在整个商业化落地过程中所遇到的挑战
林琳:
第一个挑战是安全性证明,安全性是客户最关心的,而且是最难证明的一个环节和步骤,安全性证明会分成两个部分,一个是理论安全性,另外一个是工程安全性。理论安全性是通过完成一些行业相关的认证,另外还会跟客户一起去做安全相关的POC,来解决这个问题。工程安全性,我们希望通过我们产品把多方安全计算以及联邦学习这样一个非常复杂的但又很黑核的技术,能够把它透明化,让用户可以看到每一个运行的实际的步骤,每一个节点的流转,让他们觉得这个技术相对是可控的。第二个挑战,隐私计算也是一个非常新的技术,各个方面都没有像其他的产品那么成熟,所以它的应用门槛是非常高的,我们希望通过现在已经在做的或者已经上线的,包括流程的自动化,联邦学习的可拖拽建模,以及联邦共享的一些算法库以及模型库来解决这样的问题,不断降低用户的使用门槛,推动大规模应用。
第三个挑战,这个行业有非常多的技术流派,并且到目前为止,这些技术流派之间还不能够做到互相兼容,我们也是希望在这个环节里面,可以不断地去推动互联互通,然后去推动行业往前再走一步。
联邦学习和隐私计算适合在哪些领域大放异彩?
林琳:
目前我们的多方安全计算以及联邦学习技术已经在智能风控、智能运营、政务开放和智能营销等领域都有一些非常好的案例。我们最近和交通银行以及中国移动合作的基于多方安全计算的中小企业融资服务项目,最近被选入了中国人民银行上海总部的金融科技创新监管试点应用。在这个项目里面,我们是通过多方安全计算这个技术,在数据不出域的情况下,让银行方和运营商这双方的企业的关系图谱,他们可以融合起来,帮助金融机构去识别这个企业背后非常复杂的关系网络和欺诈风险,帮助金融机构更精准地去投放中小企业的贷款,提高他们的风控水平,同时也提高用户的贷款体验。这个项目是目前第一个进入央行监管沙箱的隐私计算项目,我们认为它可能会对隐私计算整个行业在金融行业之后的发展和应用,会有很好的指引的作用。
武姗姗:
我们觉得隐私计算是通用型的技术,在各个行业都可以大有作为。除了我们之前在金融、政府、大型企业的实践外,光之树今年在智慧农业这块也做了一些银企合作的探索,我们和地方政府以及合作伙伴在推进从农业生产侧到销售侧的全流程数据安全融合,为产业金融创新、普惠的授信和农业保险的赔付提供更有力的抓手。
曾纪策:
联邦学习在国内用得比较多的场景就是风控之类的场景,有小微的信贷,贷前、贷后的审批。微众自己的几个拳头贷款的产品也用到了目前我们纵向联邦的技术。同时在横向联邦里面,微众有一个项目叫反洗钱,这个项目被深圳市作为重点推荐的试点。除此之外,还做了一个千人千面的东西,有点类似于保险或者权益。
姚明:
隐私计算技术诞生在一个特殊的环境之下,其诞生的前提是多方参与整个数据的流转,在这个过程涉及到的场景方角色包括数据提供方、数据应用方、技术服务方、政府监管方等。洞见科技的基因是服务于信用产业,外延是服务于金融产业,再外延就是服务于政务金融产业。
徐敏:
我个人看好三个行业:金融、大健康、社会服务和治理。因为这三个行业一方面是量身定制方案的,第二是它是非常个人化的场景。我讲一下场景应用后的效果,很多时候两个数据碰撞的效果非常非常出乎人意料,我们最近帮助一个银行做预授信风控模型,我们通过引入运营商的几个数据因子,和银行因子碰到一起,效率非常高,因为两个行业之前是不同的行业,运营商并不知道自己的数据在金融行业这么有用,而银行不知道运营商有多少数据,我们作为桥梁,是把整个数据进行更加高效的合作,一定带来更多的回报,对整个社会会更好。
隐私计算和联邦学习的发展趋势
徐敏:
2020年是隐私计算元年,2021年是隐私计算的应用落地年,我能想见在接下去一年中,会出现很多很多百花齐放的场景,很多场景会得到全行业的复制。蓝象智联会重点聚焦在金融行业,同时我们会重点聚焦在金融的营销和风控两个领域。
姚明:
市场关于数据流通的环节可以分为四个时代:第一个时代是数据搬家时代;第二个时代是API时代,即用即调的模式;第三个时代是沙盒模式时代;第四个时代是隐私计算时代,即2020年为元年的“数据可用不可见”、数据不离库的方式,也是沙盒模式的升级版,真实的市场是这四种模式共存。在我看来,隐私计算的应用不但要开发新的落地场景,还要升级迭代传统的数据流通或共享交换的商业模式,所以从整个市场来看,既有存量市场,又有增量市场,从技术侧来看,无论是数据搬家还是API调用,亦或是沙盒、隐私计算等,其都有各自价值发挥的空间,我并不认为某一种技术能通吃整个市场,更多的还是根据场景特点选择组合或叠加某项技术来完成商业落地。用通俗一点的话来说就是,不管白猫黑猫能抓住耗子的就是好猫,没有万能的技术,只有万能的组合,这是我的观点。
曾纪策:
我认为在技术上一定也是百花齐放,不同的隐私技术方面的成熟还就框架方面的层出不穷,框架也会趋向开放性跟成熟性。第二,微众目前在构建商业化的时候运营了一个比较大的合作的网络,有很多问题就暴露出来,我觉得标准依然是非常重要,特别是在工业应用的标准,如果我们在系统框架有一套应用场景,互联互通就会变得更为简单。
第三,因为这个网络趋向越大越丰富,治理的问题也比较突出,包括每一个用数方、供数方他的贡献度是怎么去治理的,他的安全性等等这些治理也是会变得非常重要。
第四,监管,在今年我国也发布了类似的法律法规,这个领域就大放异彩。
武姗姗:
随着隐私业务的持续的爆发,市场不断的反馈和表达,以及隐私信息的共享和交换的相关法律法规逐步的实施和构建,再加上在座的各位领导和同仁、行业共同的深耕,我们认为2021年隐私计算会获得巨大的推动力持续向前演进。在演进的过程中大家会找到更适合自己的路线,向平台化延伸或做场景化垂直深耕。同时我们会更加聚焦在互联互通,和提升隐私计算技术在客户业务场景的渗透度等方面的工作上。
林琳:
第一点,2021年,整个市场对于隐私计算的接受度会有个非常好的上升,也会有大量的商业化的案例去落地。第二点,我们非常认同技术精进这一点,我们背后有竞争,但有很多的交流,会在很小的技术细节上去共同努力攻克它,真正把这个技术再往上推一个高度。
第三点,我们认为2021年在监管层面,我们行业的标准会更加明确,我们整个隐私计算的赛道它的商业逻辑也会更加清晰。
第四点,我非常认同互联互通这个说法,因为从终极的思维来想,隐私计算将来非常有可能成为一个非常重要的一个底层的基础设施。我们希望能够把隐私计算串联起来,真正能够让数据、价值和AI的价值,以安全的方式在更多的地方流动起来。
Scan QR code with WeChat