隐私计算将成为数字经济时代的“超级潜力股”,未来去向何方?

数据包 2023-05-27
2662 字丨阅读本文需 7 分钟

隐私计算的落地场景正在从强数据需求的金融、互联网、医疗和政务领域,向智慧能源、智慧终端、智慧城市等更多行业逐步延伸。有报告预测,到2024年,隐私驱动的数据保护和合规技术支出将在全球突破150亿美元以上。如果换算成人民币,那就是千亿赛道。

2009年,美国投资34亿美元建智能电网:为了根据实际用电量输送电力,它设想在挨家挨户安装了电表,15分钟上传一次用户数据。

设想很好,但实施很快受阻,引起老百姓的抗议:“我感到自己被监视”、“电厂有什么权利这么做”。

彼时,现任锘崴科技董事长王爽正在美国攻读博士。

他发现,这些数据一旦泄露,私人生活完全可能曝光在别人眼底:比如什么时间做饭、用电脑、洗衣服......一旦被商家违规获取,比如用来做“大数据营销”,后果更难预估。

“有没有可能,既能让电厂用到这些数据,又不暴露个体的隐私数据?”王爽开始思考。也正是在这个命题的引导下,王爽开始研究隐私计算,并于2019年创办了锘崴科技:一家隐私计算技术服务公司。

最近3年,该命题的波及范围越来越广。据最近发布的《数字中国发展报告(2022年)》,国内现在拥有10.26亿网民。他们也在面临各式各样的隐私数据泄露风险。

在需求的推动下,隐私计算登上舞台,它的使命之一,便是让数据“可用但不可见”。正如开头提到的“智能电表”事件:如何在不泄露隐私的基础上,计算出“数据的价值”?

于是,一个千亿级新兴产业正在爆发。

- 01 -

数字经济的中流砥柱

什么是隐私计算?通俗而言,就是在保护隐私的前提下对数据分析、计算,这个过程中确保了“数据可用不可见”、“原始数据不外泄”。在创新创业圈,它从2020-2021年开始小火,2022年-2023年开始温火。

在投融资上,它已经有着鲜明的趋势。据铅笔道DATA数据显示,隐私计算赛道2020-2021年的公开融资金额便超过43亿元,到了2022年,单年度融资金额便突破25亿元。而据铅笔道了解,实际未公布的金额远超以上。

并且,隐私计算并非孤岛式地兴起,它是被中国发展大势带火的——它扎根于数字经济土壤。迅猛发展的数字经济为隐私计算的快速成长提供了养分和动力。

据《数字中国发展报告(2022年)》显示,2022年,中国数字经济总规模达50.2万亿元,稳居世界第二,占GDP比重提升至41.5%;2022年数据产量为8.1ZB(ZB,十万亿亿字节),稳居世界第二。

数字经济有两个核心要素,一是数据,二是数据计算。而隐私计算能完美找到数据价值与安全的最优解。

锘崴科技董事长王爽表示,数据的价值必须在流通中产生,而隐私计算提供了数据安全流通的最优解。

传统数据的计算方式下,存在不可用、被滥用、被转卖的风险。如此造成一个局面,数据所有方往往不敢共享、不愿共享,数据的流通终止之后价值便大打折扣。

隐私计算则让数据“可用但不可见”。

王爽表示:“我们进行数据共享、数据合作时,可以在不出数据源边界的前提下,完成数据价值交换,并且按用途、用法、用量使用。”

- 02 -

隐私计算的技术路线

因为隐私计算技术和方案的种类较多,为了便于理解和分类,业界通常将上述技术分为三大路径:以安全多方计算为代表的密码学路径、以可信任执行环境为代表的硬件路径和以联邦学习为代表的人工智能路径。下面简单介绍一下这3个路线的区别和联系。

1、安全多方计算(MPC)

安全多方计算(Secure Multi-party Computation, MPC)是一种密码学领域的隐私保护分布式计算技术。安全多方计算能够使多方在互相不知晓对方内容的情况下,参与协同计算,最终产生有价值的分析内容。

实现原理上,安全多方计算并非依赖单一的安全算法, 而是多种密码学基础工具的综合应用,包括同态加密、差分隐私、不经意传输、秘密分享等,通过各种算法的组合,让密文数据实现跨域的流动和安全计算。本文第三部分会简单介绍其中的部分算法,来阐述其具体保护原理。

下面是安全多方计算的其中一种简单实现方案示意图:

2、联邦学习(FL)

联邦学习(Federated Learning, FL)又名联邦机器学习、联合学习。相比于使用中心化方式的传统机器学习,联邦学习实现了在本地原始数据不出库的情况下,通过对中间加密数据的流通和处理,来完成多方联合的学习训练。

它一般会利用分布式数据来进行本地化的模型训练,并通过一定的安全设计和隐私算法(例如同态加密、差分隐私等), 将所得到的模型结果通过安全可信的传输通道,汇总至可信的中心节点,进行二次训练后得到最终的训练模型。

由于密码学算法的保障,中心节点无法看到原始数据,而只能得到模型结果,因此有效地保证了过程的隐私。

联邦学习和多方安全计算的区别,主要在于应用场景有较大不同。因此联邦学习的实现主要“面向模型”, 其核心理念是“数据不动模型动”,而多方安全计算则是“面向数据”,其核心理念是“数据可用不可见”。

3、可信任执行环境(TEE)

可信任执行环境(Trusted Execution Environment, TEE)指的是一个隔离的安全执行环境,在该环境内的程序和数据,能够得到比操作系统层面(OS)更高级别的安全保护。

其实现原理在于通过软硬件方法, 在中央处理器中,构建出一个安全区域,计算过程执行代码TA(Trust Applition)。

仅在安全区域分界中执行,外部攻击者无法通过常规手段获取和影响安全区的执行代码和逻辑。

同时计算数据通过相关密码学算法加密,来保证数据只能在可信区中进行计算,其简单实现示意图如下所示:

可信执行环境和前文提到的两种技术路线的区别, 在于不需要依赖过多复杂的密码学算法,因此计算效率高,且能够实现的计算逻辑更加丰富。

- 03 -

隐私计算的未来去处:

数据与价值的桥梁

隐私计算公司的未来去处在哪?结合过往12年行业观察,锘崴董事长王爽将其总结为:数据与价值之间的桥梁。

结合过往创业经历,他介绍道:这个定位已经在多个产业跑通。

比如,隐私计算可以成为医疗数据与价值的桥梁。

在医疗行业,隐私计算能帮医药企业、医疗机构、保险公司提高数据安全管理水平,还能通过病例数据共享形成联合AI模型,进一步提高精准度,服务新药研发、临床辅助诊断、医保控费等场景。

在金融领域,隐私计算能够帮助监管部门降低风险,帮助企业拓展业务,服务于普惠金融、银行互联网营销、保险联合营销、风控、征信等场景。

隐私计算也能成为政务数据与价值的桥梁。隐私计算能帮助政府各部门数据实现互联互通,促进政府跨部门协同,服务于政务数据开放、反赌反诈等场景。

在这些领域,锘崴已经完成了商业化落地。比如在医疗领域,锘崴的产品已经应用于临床辅助诊断、新药研发等;通过隐私计算技术,锘崴完成了全国首例全基因组关联分析案例,打通了多家医院的基因数据。“我们也建立了基于隐私计算的癌症专病网络,通过该网络赋能新药研发。”王爽介绍道。

王爽认为,在数字中国建设大背景下,科技是关键抓手,隐私计算公司应该是数据与价值之间的桥粱。这也是锘崴的定位,做一家“隐私计算+”公司,通过底层技术赋能不同的行业应用。

从行业生命周期看,隐私计算尚处于“初级阶段”,未来3年将进入超速增长阶段,这预示着它未来的潜力巨大。

据华经产业研究院报告,未来两年内,隐私计算将以超110%的速度增长——至2025年,市场规模达到192.2亿,而这个数字在2021年仅为4.5亿元:4年增长超187亿元。据Gartner报告指出,至2024年,隐私驱动的数据保护和合规技术支出将在全球突破150亿美元以上。

按照to B产业的增长规律,年增速超过30%便能成为“快速赛道”。以此标准来看,隐私计算将成为数字经济未来3年的“超级潜力股”。

文章来源: 铅笔道,中国新闻网,华为云开发者联盟

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:数据包
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...