多方安全计算,理想与现实的博弈,究竟谁更胜一筹?

语言: CN / TW / HK

数据智能产业创新服务媒体

——聚焦数智 · 改变商业

1982年,姚期智教授给业界讲了一个很好的故事:在没有可信第三方的前提下,两个百万富翁,如何在不泄露自己真实财产的情况下,却能准确地比较出谁更有钱?通过解决这个问题,多方安全计算走进了大众的视野。

多个持有各自私有数据的参与方,在不泄露各自真实数据的情况下,共同执行一个计算逻辑,从而获得计算结果。举个简单的例子,一位招聘专家同时面对两位候选人的时候,在不违反前述就职单位对薪资保密的要求下,却能通过多方安全计算得出谁的薪资更高,而在得知结果的过程中,不依赖于任何可信的第三方,这就是多方安全计算的实际应用。

多方安全计算技术框架 图片来源:隐私计算白皮书(2021)

2018年,中国信息通信研究院(以下简称“信通院”)发布的《数据流通白皮书》中对多方安全计算的重要意义给出了明确的说明:安全多方计算技术,可以确保在保护数据提供方的前提下,实现多方安全协同计算,并确保各参与方得到正确的数据结果反馈。安全多方计算拓展了传统分布式计算以及信息安全范畴,为网络协作计算提供了一种新的计算模式,对解决网络环境下的信息安全具有重要价值。利用安全多方计算协议,一方面可以充分实现持有节点间互联合作,另外一个方面又可保证密码的安全性。

随着大数据产业的蓬勃发展,数据的安全问题日益凸显。《网络安全法》、《数据安全法》、《个人信息保护法》等法律法规的相继颁布实施,也在助推数据隐私保护进入了一个发展的新阶段。尤其是《个人信息保护法》的落地实施,对个人数据信息也有了进一步的监管规范。

不管是监管层面还是企业、个人层面对于数据的保护意识都逐渐增强。隐私计算以及多方安全计算的出现,很好地解决了对于数据隐私保护的安全问题。同时,在充分确保数据隐私不被泄露的前提下,多方安全计算对于数据确权、数据结果的价值挖掘也具备相当重要的意义,对于助推数据要素的共享流通,更是起到了关键性的安全作用。

市场规模逐渐显现,市场潜力还有待深度挖掘

从2020年开始,隐私计算火了,作为隐私计算的三大主流技术:多方安全计算、联邦学习、可信执行环境也纷纷让市场参与者们心动不已。

根据fortune business insights发布的数据显示,2021年,全球隐私计算市场规模达15.7亿美元,预计到2028年将达到177.5亿美元, 2021年~2028年的复合年增长率达41.5%。

而另据腾讯发布的《深潜数据蓝海:隐私计算行业研究报告》显示,目前中国隐私计算市场达到上亿元规模,预计未来几年将形成数十亿规模的市场。乐观估计,未来3年将达100-200亿人民币的空间,甚至将撬动千亿级的数据平台运营收入空间。

艾瑞咨询发布的《2022年中国隐私计算行业研究报告》称从商业模式及市场规模来看,目前隐私计算正值行业基建期,市场需求集中在基础产品服务,数据运营服务将开启“隐私计算+”的蓝海市场。

报告预计:2022年~2025年是中国隐私计算基础设施建设的关键时期,2023年将进入前“隐私计算+”时代。“隐私计算+”时代是在完善隐私计算基础设施建设的前提下,行业用户展开应用层差异化场景实践的时期。商用实践的聚焦点由“基础产品服务”转向“数据运营服务”。因此打造卓越数据智能产品将成为核心竞争力。

为什么隐私计算、多方安全计算的需求如此旺盛?隐私最大化,或许是助推多方安全计算的最大推手。从技术原理来说,多方安全计算是基于如不经意传输、混淆电路、秘密分享等密码学的原理基础,实现两方或者多方的协同计算。在协同计算的过程中,原始数据不会被泄露,只有计算的结果可以被数据接收方获取。而且大部分的结果获取,也都是需要通过密钥取得,因此具备了较高的安全性,可以充分满足多个数据参与方对于原始数据不出库,数据可用不可见的需求。

《2022年中国隐私计算行业研究报告》中明确指出:多方协同是多方安全计算应用实践的一大特点,不同于其他类型技术,在商用实践中,技术服务商除了提供平台建设外,还会为客户提供数据调用(寻找数据源)服务,且多方安全计算也经常需要两方以上的参与者展开联合计算,因此多方协同特性十分明显。

基于这些优势,多方安全计算已经在金融、医疗、政务等敏感性数据应用广泛的行业,率先实现了数据加密技术与安全的完美融合,提供了解决数据安全、数据隐私保护与数据价值挖掘之间矛盾的新思路。

而且,多方安全计算在监管层面也获得了一定的认可。中国人民银行在《 金融科技(FinTech)发展规划(2019—2021年)》中就明确指出要构建适应互联网时代的移动终端可信环境,充分利用可信计算、安全多方计算提升金融科技创新。可以说,多方安全计算的发展之路已初见雏形。然而面对种种机遇,多方安全计算的真正价值尚有补足的空间。

富数科技的相关负责人也曾向数据猿表示:现阶段中国隐私计算市场规模空间尚可,市 场收入主要来源于产品售卖或平台建设方面,大量技术服务商的营收规模仍然处于亿级以下水平。在金融机构联合风控与政务数据开放这些当前隐私计算主流应用场景中,技术厂商的方案逐渐趋同,但随着标准化产品、性能要求、场景需求复杂化等的出现,模块输出比例会有所下降。未来一段时间内,在生物医疗、能源制造、智能网联等其他行业的落地与商业模式实现仍待开发探索。多方安全计算在未来的一定时间段内仍会是主流的技术输出路线。

行业发展日趋完善,竞争格局尚未明晰

自2019年开始,我国隐私计算行业进入快速发展期,国内众多厂商开始布局相关赛道,随着行业客户在应用层实践的逐步加深,数据运营、算力加速等需求也不断涌现。比如综合型互联网巨头蚂蚁集团、百度和网络安全及大数据公司京东数科,人工智能厂商等企业赛道的参与者一起涌入隐私计算行业,同时也涌现出了如华控清交、蓝象智联、锘崴科技等大批垂类的初创企业。

据企查查数据不完全统计,2020年我国隐私计算行业新成立企业数量为71家,同比增长33.96%。截至目前我国隐私计算行业注册企业或涵盖隐私计算业务的企业超百家,其中,提供多方安全计算业务、产品或具备相关专利的企业超过80家。

2021年,中国信息通信研究院云计算与大数据研究所(以下简称“云大所”)发布的《隐私计算白皮书》中提到,从技术路线上看,多方安全计算的复杂度高、开发难度大,龙头企业多致力于此,力图打造以多方安全计算为底座的数据流通基础设施,26%的企业布局了这类技术方案。

国内隐私计算平台应用技术路线 来源:中国信通院研究统计结果

互联网巨头、综合IT企服厂商以及其他赛道企业的涌入,让隐私计算领域鱼龙混杂,其发展也充满了一定的未知。由于目前隐私计算行业还处于早期发展阶段,尤其是多方安全计算行业的发展方向还不甚明朗,因此未来的竞争格局也尚未可知。

在行业发展方面,目前我国也在积极推动由云大所牵头,联合行业领军企业、专家制订及修订的行业发展标准。截至目前,已开展多批可信隐私计算评测,目前已有多款隐私计算产品通过该功能和性能评测,覆盖了国内90%以上拥有隐私计算产品的重要企业。

根据信通院的官网显示,目前已经制定并设立的关于多方安全计算的相关标准及评测有:《基于多方安全计算的数据流通产品技术要求与测试方法》、《隐私计算多方安全计算产品性能要求和测试方法》、多方安全计算基础能力专项评测、多方安全计算性能专项评测等等。由此可见,从行业发展层面,多方安全计算领域已经充分引起了行业的广泛关注。

除了行业对隐私计算领域以及多方安全计算领域关注度明显提高之外,资本市场对于隐私计算领域的企业也格外关注。据已发布的公开资料以及某网站不完全统计,从2021年到2022年上半年,隐私计算领域企业融资共14家、融资21起。其中,2021年共有13起,2022年至今已有8起。其中,华控清交、洞见科技、数犊科技、蓝象智联、富数科技等都具备非常强劲的多方安全计算领域实力。

从已披露的融资金额来看,融资金额达到1亿元以上的有华控清交(B轮,7亿元人民币)、数牍科技(Pre-A轮+A轮,3.08亿元人民币)、翼方健数(B+轮,3亿元人民币)、蓝象智联(A轮,约2亿元人民币)、锘崴科技(B轮,亿元人民币)。

从行业整体来看,目前隐私计算赛道的竞争者从数量上来说体量还不够大,因此竞争格局也尚未完全明晰。但是,各个厂商已开始布局细分领域,以期在市场还未完全成形之前,抢占先机。从发展领域来看,目前多方安全计算应用较多的是在金融。据艾瑞咨询《2022年中国隐私计算行业研究报告》显示,预计2022年展开隐私计算投入的金融机构数量约是2021年的2倍或2倍以上(增量部分包括了在2021年处于POC进而在2022年正式投入应用的金融机构)。参与隐私计算实践的金融机构数量的增加,也在一定程度上让技术实践广度、深度实现同频提升。

理想与现实的博弈,决不能让技术“卡脖子”

只有技术跑赢市场,才能占得先机!但是不得不说,技术厂商们特别容易陷入一个怪圈,那就是将自身的技术优势无限放大,或者夸大概念性成分,但是到实际落地应用的阶段才发现,很多技术难题尚未解决,产品功能尚未完善,应用场景适配能力还有待提升等等,这显然也是技术与市场的天然矛盾。

多方安全计算确实可以实现更高的安全性,但是同样需要付出更高的计算代价。隐私计算之所以能够获得业界广泛认可,究其原因主要是实现了密态数据的分布式处理,相比过去的数据脱密、去标识化等带来了新的机会。

以同态加密技术为例,多方安全计算理论上可以实现任意函数计算,但是实际应用过程中往往效率过低。虽然满足了数据的安全性、隐私性,但是复杂的算法本身也存在一定的黑箱,无法预防原始数据是否被投毒,也就保证最终运算结果的准确性。

也就是说,要想实现理想状态下的安全、准确、高效,还需要首先解决一些先天的技术障碍,才能在商业落地上实现更快速推进。 虽然从数据以及真正的技术能力来看,多方安全计算依然有很多技术难点没有突破,但是市场已经慢慢开始接受了这种新思路。

根据此前中国信通院调研数据显示,目前大约44%的隐私计算产品已经进入到实施阶段,占比进一步提升;处于研发阶段的隐私计算产品占比19%,占比有所下降。虽然我们无从获知,多方安全计算相关的详细数据,但是这无疑是一个好的信号,证明隐私计算甚至多方安全计算的项目落地应用正在快步进入实施阶段。

根据艾瑞咨询调研显示,产品安全&安全自证能力(81.8%)最受隐私计算实践者关注,其次为产品性能(76.9%)和产品功能(69.6%)。基于对安全和性能的追求,行业用户正在加深对隐私计算软硬件结合技术方案的关注,越来越多的隐私计算厂商在软硬件结合技术方案上展开布局。隐私计算甚至多方安全计算已经初步得到了市场的认可,那么下一步就是如何在技术上更新一步,拓展更大规模的用户市场。

从数据安全保护,以及数据合规的角度来看,多方安全计算可提升的空间还有很多。

首先,多方参与计算的前提是保障各方提供的数据都是准确可靠的,但在现实中这未免有点理想化,那么如何确保参与方不进行数据投毒,或恶意造假?这算是对于各厂商的第一重考验。

其次,由于多方安全计算是基于密码学理论所进行的一系列运算,那么算力要求自然更高。尤其是当参与方数量超过一定规模的时候,如何提升算力就成了一道门槛。

多方安全计算训练流程 图片来源:隐私计算法律与合规研究白皮书 (2021 年)

第三,即便是采取了加密的方式,也难保参与方可以通过多次回溯的方式获得一部分原始数据的分布。那么如何在计算过程中,设置层层关卡,充分保障数据安全呢?

在发展的过程中,其实已经陆续有厂商提供了相应的解决方案。比如在安全保障的过程中,某头部厂商搭建了一个密码运算体系。在基础操作层面,用密码学协议替代常规运算,并在此基础上重新架构、改造了基础函数以此来为客户创建一个完整的密码运算体系。从而保证数据流通的安全性。

与此同时,亿欧智库《2021-2022中国金融数字化“新”洞察行业研究报告》中指出:在实际推进业务的过程中,由于隐私计算涉及多种技术算法、平台产品、专有名词,导致技术原理、解决方案等无法通俗解释,难以与客户形成高度同步。而这也使得用户在购买隐私计算服务时会有所犹疑,不利于业务开展。尤其是多方安全计算,往往一个应用案例要接入多个参与方。不同的参与方,对于业务、算法、架构的理解也不尽相同,算力能力、资源能力也都各有参差,导致协同计算的过程中,推进效率受到一定的影响,也间接阻碍了项目的快速实施。

针对以上这些技术难点,数据猿也分别采访了一些行业内的资深从业者,也分别从不同的角度给出了一定的技术解决可行性。

锘崴科技的CEO王爽教授在此前的采访中就曾向数据猿透露:目前多方安全计算已经具有了一定的技术解决能力。比如在很早的时候,多方安全计算就已经可以同时支持加法和乘法的运算。同时,面对大规模的数据时,多方安全计算也能解决多方规模化数据的计算问题。以锘崴科技为例,在推进新药的研究案例中,需要同时接入几百家机构不同规模的数据源,锘崴科技可以通过自身的多方安全计算技术,融合多种其他能力如同态加密技术、可信执行环境等,不断提升系统的稳定性,也能保证算法模型的准确性,数据结果的准确性。同时,通过区块链技术进行全程存证,保证了数据的可追溯及审计。

当技术实现完全领先市场需求的时候,多方安全计算才能从真正意义上实现对市场的主动权。但现阶段,除了在技术侧仍要持续发力之外,还需要在更多的细分场景下进行尝试,才能加速实现多方安全计算在更多领域的应用落地。

技术尚有突破空间,多方安全计算+或将成为一种新范式

虽然目前已有众多厂商在不断地通过提升基础技术能力、算力能力、集成能力等积极提升多方安全计算的应用性能,但是不可否认,在实际落地应用的过程中,依然会遇到重重阻碍。

基于现阶段多方安全计算的发展现状,未来可能有一些重点方向是多方安全计算厂商,乃至隐私计算厂商的主要发展重点。

第一:多方安全计算需要不断提升系统的稳定性、易用性以及安全性,提振多方安全计算技术的落地应用信心,以促使更多数据参与方主动愿意加入到多方安全计算中,整体提升数据保护隐私以及隐私计算行业的共同发展。同时,让更多的机构及人员能够以较少的人力成本、学习成本、经济成本参与到多方安全计算中,以推动整个行业的健康快速发展。

第二:相比其他隐私计算技术,多方安全计算对计算的精确度以及参与方的规模都有一定的限制,未来还需不断突破参与方的规模限制 ,不断提升多方安全计算结果的精确度,以及不断提升算力。同时,提升对恶意模型或共谋模型等的抵御能力,也将是未来一段时间,需要持续性加大投入力度破解的难题。

针对以上痛点,瑞莱智慧所提出的解决方案是:针对参与方数目不断变大导致的计算效率低下,不是必然出现,但需要根据AI与密码学协议进行co-design,并以AI设计为主导;毕竟AI是解决模型准确度(数据价值)的关键,且AI模型范式比密码学可选方案丰富得多。当确实出现了因“参与方数目不断变大导致的计算效率低下”,可以采用TEE/同网密态等方式进行规避。

针对性能问题,则可以在密码、算法、硬件三个层面同时进行加速优化,包括密码库优化、模型压缩、硬件加速等,比如瑞莱智慧目前的解决方案包括全同态加密的实现,通过编译器驱动高效加密算法的优化,隐私保护下完成全流程建模,总耗时从日级别缩短到小时级别,领先业内平均水平数十倍。

第三:生态能力的融合,多方安全计算+,或许也将成为一种未来发展的可能性趋势。隐私计算也好,多方安全计算也罢,都不是一门单一的技术,都需要同时融合多种能力,多种前沿技术才能不断实现突破。生态能力的融合,与其他厂商进行技术及其他能力的互补,将会大大提升多方安全计算的落地实战能力,也将不断扩大多方安全计算可能实践的更多场景。相比闭门造车而言,相信各大厂商也更愿意以一种拥抱开放,共同发展的心态,推动行业整理快速进步。

蓝象智能CEO徐敏,对于生态能力方面也曾向数据猿表示:对蓝象来说,首先从产品层面需要和生态伙伴进行整合。其次对整个销售渠道的增强,对数据运营能力增强,对业务运营的能力增强,以及一些行业拓展,都是我们需要的,我们的目标和策略是跟更多人合作,推动行业成功。隐私计算是基础设施,它强调的是在保证数据不出域、可用不可见的前提下数据价值的联通能力。如果什么时候隐私计算本身行业不见了,但是出现很多通过隐私计算实现业务融合的行业,那时候我认为这个行业就成功了。

虽然现阶段,多方安全计算还存在很多提升的空间,但是不可否认,作为隐私计算的主流技术之一,多方安全计算在数据隐私保护方面确实取得了阶段性的突破,对于我国数据要素的流通共享起到了一定的促进作用。

而随着越来越多的互联网服务都需要依赖个人的隐私数据,可以预见,个人隐私保护也将成为多方安全计算一个重要的应用场景。未来,不止多方安全计算厂商需要在技术上不断创新突破,行业整体还需要更进一步的政策指导、标准规范的快速落地,以及生态化能力的整体建设,才能推进多方安全计算行业更加健康有序地发展。然而,多方安全计算最终是以孤胆英雄单打独斗破圈,还是成为尖峰部队中的排头兵突围却不得而知。但是不管最终是哪一种成功的方式,我们都希望多方安全计算能够在数据要素流通的大生态中,发挥更大的价值和作用。

创新服务企业榜

创新服务产品榜

最具投资价值榜

创新技术突破榜

条漫:《看过大佬们发的朋友圈之后,我相信:明天会更好!》

联系数据猿

「其他文章」