防止数据泄露,隐私计算成为数据“安全卫士”,哪类企业更易在百亿潮头立足?

4963 字丨阅读本文需 11 分钟

近日,“学习通数据库疑发生信息泄露”冲上了微博热搜第一,再次引发了全民对于隐私的讨论。

据安全行业业界内消息,国内众多高校都在推荐学生使用的主流学习软件"超星学习通",被曝出了数据库信息泄露,其中包含学校、姓名、手机号、学号/工号、性别、邮箱、密码等全面的个人隐私数据,泄露超出了1.7亿条,不仅在境外平台被公开售卖,并且售价仅需1.2万人民币。

眼下的信息数据时代,确实为人们生活带来了不少便捷。但时不时就爆出的重大隐私问题,也让人们对这个信息数据时代又爱又恨。

那么,挖掘数据潜力和保护隐私底线,真的没有办法共存吗?

如何在不侵犯隐私的前提下充分利用数据价值呢?

“隐私计算”或许是个答案。

什么是隐私计算?

数字经济高速发展之际,数据涉及的隐私问题只会越来越频繁。

当前,我国数字经济增加值规模已由2017年的27.2万亿元,增加至了2020年的39.2万亿元,5年复合增长率为11%。2020年全球数字经济占GDP高达38.6%,结合数字经济随着GDP增速变化规律推断,2025年国内数字经济市场规模将占GDP比重55%,市场规模可高达65万亿元。

数据作为数字经济的核心生产要素之一,通过跨领域、跨行业、跨地域的机构间数据流通释放要素价值。

但是,在大数据产业迅猛发展的背后,数据隐私安全相关问题也在逐渐暴露,传统“复制式”的数据流通方式让商业隐私信息、个人隐私信息等产生了泄漏,无法满足法律合规要求。

如果在数据提供方处展开计算,虽然可以让数据不出域,但会暴露业务方的计算规则与计算模型,进而暴露业务方的商业隐私。因此,若想让数据要素实现良好的市场化配置,行业首先需要完善数据可信流通能力的建设。

那能不能够构建起一个“可用但不可见”的数据可信流通范式呢?答案是可以的。

隐私计算,又称隐私保护计算,能在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算,保障数据以“可用不可见”的方式进行安全流通。

而且除了“数据可用不可见”的特性外,隐私计算中的多方安全计算技术也可以控制数据的用途以及用量,进而做到数据“用途可控可计量”。

在应用实践中,隐私计算还可以融合区块链技术来强化在“数字身份、算法、计算、监管”等方面的信任机制,进一步完善数据要素的确权、定价与交易的可信体系建设。

数据从何而来?

在隐私计算业内有一句“谚语”, “心有余而数不足”,用来形容缺乏数据的业务运营就像“空中楼阁”,数据从何而来?特别是在《数据安全法》《个人信息保护法》等法规出台后,企业如何安全合规地利用数据来支撑业务运营,隐私计算为其提供了一种技术手段。

徐敏告诉记者,从应用层面而言,目前隐私计算重点在对接的数据来源包括三个:银行数据、运营商数据、电网数据。形成这一结构的原因在于,这类数据规范性较强,标准化程度较高,合规运用的效率较高。

“运营商数据很丰富,用户通话信息、上网行为信息和位置信息等,运营商都有,这些数据对于评估分配一个人的资信情况很有价值,这些数据不能对外提供,但是通过隐私计算的方式,可以综合这些因素,再和银行的数据一起形成评级,来标定一个主体的风险等级。”徐敏说。

此外,电网机构也是重要的数据来源。一位隐私计算公司的技术人员告诉记者,企业用电负荷、缴纳电费等电网数据,可以反映企业的经营状况,但只有这一数据的价值非常有限。如果结合工商登记信息、司法履约信息、对外投资信息等外部数据,构建科学的算法模型,就可以形成企业的评级或征信信息,等于挖掘出了更多的数据价值。

这个思路已经用于实践,同盾科技的隐私计算服务中所使用的数据源,便包括部分电网数据。李晓林告诉记者,他们采用的数据处理方式叫作知识联邦模式,这种模式不同于使用本地的海量数据进行机器学习、模型训练,而是利用多方的部分数据来提炼知识达到训练机器学习的作用,从而撬动更大的数据资源来共创和共享知识。

据李晓林介绍,知识联邦模式是一个多层级的模型系统。可以先在内网层面操作,比如在一定范围内交换不同的电网数据,把这部分数据加密处理,进行模型训练,用于训练的数据不出本地,在模型的科学性和应用性达标后,用于训练的数据将被清除,而这个模型将用于电网数据和其他外部数据融合。“这种模式更安全,且不能反推出原始数据,已经被用于金融反欺诈、企业融资、营销、疫情预报等场景。”他说。

而拥有数据资源或数据使用权的一方,也有开发数据价值的诉求,换言之,就是他们也需要和外部数据互联互通,推动多数据资源整合。一位运营商人士表示,他们有专门的部门和团队开展合规数据经营业务。现在,隐私计算的服务商,也是他们的客户。在与客户的合作中,运营商遵循两个原则:其一,不外泄个人信息,具体包括电话号码、APP装机种类、开机时长等;其二,相关信息不能对应个人姓名、电话,且信息不能“出本地”。

但是,他拒绝向记者透露这种合作具体的费用标准。

记者了解到,国家电网也成立了商用大数据、征信公司,拓展电力大数据的应用场景,打破各行业间的数据孤岛,推动数字经济融合发展,隐私计算将发挥更大作用。

“隐私计算有助于将数据的所有权和使用权分离,并创造商业价值,这在数据成为生产要素后,有着非常重大的现实意义和作用。”徐敏说。

互联互通是共识

目前,国内隐私计算的主要参与者包括BAT等大型互联网公司以及隐私计算独立技术厂商如星云Clustar、华控清交、数牍科技等。此外,部分金融机构也在通过自研或与隐私计算厂商合作进行探索。

IDC中国金融行业市场分析师王晨认为,目前市场上各主要厂商在路线与定位等方面具备多样性,不同的厂商间有竞争也有互补。接下来,在数据要素有序流通体系的建设方面,需要更多数据参与方一起推动规范与标准的完善,打通因技术差异造成的数据流通壁垒,并确保技术与应用满足穿透式监管的要求,从而形成数据链条中的数据提供商、数据需求方、技术提供方、监管方等不同主体共同参与、有序协作的良性生态体系。

目前,为打通因技术差异造成的壁垒,避免形成“计算孤岛”,互联互通已经成为业内共识。中国信通院联合多家机构编写了《隐私计算跨平台互联互通》系列标准的总体框架,其中就涉及通信规范、互联协议以及应用规范等。

开源也被认为是隐私计算互联互通的实现路径之一。开源基于“开源开放、技术普惠”的逻辑,有助于软件开发降本增效、加速迭代、促进产业协同创新,挖掘数据价值,为各产业技术发展提供动力。中国信通院发布的《隐私计算白皮书(2021年)》指出,开源协同正加速隐私计算的技术迭代。隐私计算作为保障跨机构数据安全合作的关键基础,也注定包含开源模式。开源的成本优势不仅体现在技术复用,降低开发门槛,还体现在问题发现和修复敏捷性上,有利于加速技术升级和商业化项目落地。数据显示,55%的国内隐私计算产品是基于或参考了开源项目。

相关分析认为,隐私计算技术发展和规模化应用的关键是构建生态,让生态各方连接和协作。而开源项目天然具备技术开放性和迭代能力,各方的互联互通成为生态构建的关键。相对于当前不同隐私计算厂商间技术路线的“百花齐放”,基于同一开源框架的互联互通将更有助于隐私计算产业生态的形成。

赛道有多大?

牵涉到算法、模型、数据这些颇具“技术含量”的语汇,隐私计算给人“高深莫测”的感觉,技术是隐私计算立命根本,但这个赛道前景如何?商业化道路能走多远?应用空间也是不可忽视的问题。

就商业模式,徐敏告诉记者,隐私计算一般有两种模式:一种是收取隐私计算系统搭建的费用,这种模式下,收入是以“单”计算的,根据客户需求的不同,有不同的报价组合;另一种是收取运营的费用,即搭建系统完成后,按照客户使用查询的次数收费。这部分费用先由隐私计算服务供应商向客户收取,而后隐私计算服务的供应商,再向数据方支付使用数据的费用。

至于处理海量数据和查询服务的系统运算速度如何,是否会影响“客户体验”,徐敏表示,这其实不是太大的问题,他以银联数据和新网银行牵头的、蓝象智联参与的多家金融机构间数据共享平台为例,目前每天大约有60多万笔跨机构隐私查询,每笔大概只需要100~200毫秒。

“这个速度相当于在百度上搜索词条,按回车键就立刻出现搜索结果,也就是‘实时’速度。”一位隐私计算业内的技术人士解释道,如果慢于这个速度,是无法商业落地的。

除此之外,在与客户建立了较为紧密的合作关系后,隐私计算服务供应商还可以根据客户的需求,针对不同的应用场景,提供建模等方面的咨询服务,这也是根据客户的需求组合报价。“这种打包提供综合性的服务,也是我们盈利的商业模式之一。”同盾科技的相关人士说。

目前,隐私计算尚属起步阶段,业内则将2021年视作“元年”。

童玲认为,新技术的崛起通常有三个阶段:第一个阶段是寻找样本客户,也就是第一批吃螃蟹的人;第二个阶段是经过第一批客户的应用,让大家看到一些真正有价值的场景,这些场景未来可能会成为现象级场景;第三个阶段则是相关政策、监管等外部环境的支持。“经过这几个阶段,这项技术就能够加快推广和应用。”她说。

正在为这项新技术崛起跃跃欲试的企业主要有两类:一类是大型互联网平台企业体系中从事隐私计算业务的公司,比如蚂蚁金服的蚂蚁摩斯链、腾讯云隐私计算等;另一类是初创类公司,它们要么具有高校院所的背景,要么主要的骨干人员来自大型互联网公司。业内人士告诉记者,这其中较为典型的,一个是华控清交,另一个是蓝象智联。

隐私计算作为数字经济底层基础设施被看好,但目前落地的场景有限,有观点认为其商业化应用的前景尚待验证。一位为金融机构提供咨询服务的人士告诉《等深线》记者,隐私计算概念很火,在内外部数据交换融合时发挥较大作用,但在中小银行领域的市场一直一般,这是为什么?就是因为没有应用层的场景。

该人士称,数据不足是行业面临的问题,但在实际应用中,相较于外部数据,通过线下渠道获得的非标准化数据可能能构建更有价值的用户画像。他举例说:“中小银行的一部分客户本身是无法数字化的,比如一些小微企业是通过个人账户收款的,社保、税务等系统的数据并不能准确反映这类企业的情况,还是需要客户经理线下去做尽调,了解情况。”

不仅如此,金融数据对外开放也是个复杂的问题。彭凯告诉记者,很多信息一旦进入金融业务领域,就会涉及到征信问题,如果变为征信信息,就不能轻易拿出去合作了,因为在现有的监管体系下,需要具有个人征信业务牌照的机构才能开展此类业务。

前述天使投资机构的投资人告诉记者,隐私计算已经不是蓝海。他做了一个推算,未来5年,大数据市场交易额约在500亿~600亿元,通过与数据持有方分润,隐私计算服务商可以获得百亿元左右的市场规模,同时,通过自身经营,也可以获得百亿元左右的收入。因此,他保守估计,隐私计算未来一段的市场规模应在200亿~300亿左右。

“从市场容量来看,隐私计算很难是一个独立的赛道。”前述同盾科技的相关人士说。

“应用场景要继续扩大,否则总能看到天花板,这会影响到市场对隐私计算的持续投资。”前述天使投资机构的投资人说。

当下,在隐私计算赛道中投资的资本,其规模和量级各异。其中既包括金沙江、联想这样的大型知名投资机构,也包括一些规模不大的投资机构。“甚至就是私人金主投钱。”一位业内人士说。

“隐私计算本质上是促进数据安全流通的底层技术,是数据经济领域的一个基础设施,既和数据有关也和安全有关,所以我们目前选择的投资方里更倾向于有国资背景的人民币基金。”童玲说。

隐私计算的鼻祖姚期智2004年返回中国,并于2016年放弃美国国籍,转为中科院院士。2021年6月18日,姚期智获得第36届日本京都奖。姚期智在颁奖演讲中说:“科学带来了创新,可以改善人类的现状,为未来所面临的挑战做好准备。”

隐私计算带来的创新,会给人类带来怎样的未来?

哪类企业潜力更足、确定性更强?

虽然金融行业目前是隐私计算的领跑行业,但成长潜力最大的或许还会是互联网巨头等企业。

当前属于隐私计算产业上游的是数据提供方,金融数据提供方包括各级金融机构、银行、互联网公司等,医疗数据提供方包括各级医院、医保机构、医药公司等,政务数据提供方包括各地大数据局、税务、司法、工商等公共部门。

产业中游则是隐私计算厂商,包括隐私计算的初创/垂直公司、互联网巨头、IT公司等。代表公司分别有洞见科技、蚂蚁集团、华控清交、诺崴科技、微众银行、安恒信息等。

产业下游则是数据使用方,包括医疗机构、金融机构、政府等。除上述三类主体外,产业链上还包括监管方和第三方应用提供商。

2020年是隐私计算的元年,金融行业是隐私计算领跑行业。目前,隐私计算目前正处于落地初期阶段,金融、政务、通信运营商领域的商用实践相对领先。不过当前正值行业基建期,市场需求集中在主要实施方式为本地化部署的基础产品服务。

而数据运营服务,或将开启“隐私计算+”的蓝海市场。

数据运营的理想模式是将数据智能产品打造成算法模型和多方数据的综合性产品,从而提供“数据调用+算法模型”的整体服务。数据运营方需要通过数据运营能力来持续创造价值,并可延伸至利润空间更大的两种商业模式:数据分润和业务分润。

其中,互联网大厂、深耕垂直场景的初创企业以及产业内头部企业发展更具确定性。

隐私计算解决方案对其底层技术的成熟度依赖极高,但仅凭借隐私计算底层技术,企业是无法为用户提供有效的服务。用户的需求往往对于数据的需求极为定制化、专业化,导致隐私计算供应商需要为用户提供有效的脱敏数据。

所以企业是很难凭借单一的竞争优势建立隐私计算生态,而像互联网大厂、深耕垂直场景的初创企业以及产业内头部企业,是同时能掌握优秀的算法与丰富的数据资源,这为其成功布局隐私计算提供了更大的可能性。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...