数据还分“冷”“热”?解析东数西算伟大产业的三大基础“底座”

微观人 2022-09-26
2859 字丨阅读本文需 8 分钟

今年2月,国家发改委等多部门印发通知,建设10大国家数据中心集群,全面启动“东数西算”工程。这一项目意在用西部算力支持东部数字经济,同时拉动西部发展,截至今年4月已带动1900亿元新项目。

近几个月来,算力、网络一直是东数西算工程中的话题焦点。本周,由知名机构中国智算产业联盟牵头发布的《东数西算下新型算力基础设施发展白皮书》(简称:白皮书)传递出一个新观点——海量温冷数据的“东数西存”或许才是首要课题,引起产业的广泛关注。

温冷数据占95%,“东数西存”引关注

作为国内首部关于东数西算智能算力设施的产业白皮书,报告指出:占据数据总量95%的温冷数据更适合“西算”。所谓温冷数据,简单来说,是指代对实时性要求较低的数据。这一说法明确回答了“什么数据适合‘西算’”的关键问题。

我们知道,在信息传输中,无论网络带宽多大,传输时延都是客观存在的。因此,在 “东数西算”中,需要被计算节点频繁访问、网络时延要求高的实时在线类 “热数据” 不适合 “西算”,而离线类访问频率低、网络时延要求不高的“冷数据”,以及介于两者之间的“温数据”,更适合“西算”。

张新凤告诉智东西,占据数据总量的95%温冷数据对存储的需求凸显,要求东数西算注意算力和存储的协同发展。在实际应用中,一些重计算的应用场景将算力排在第一位,以存储辅助支撑;但有不少用户以数据密集型应用为需求,存储占比在数据中心中会更大。

作为东数西算的子场景,东数西存需求日益引起关注。存储产业已经被东数西算工程带动。

从曙光存储自身来说,其今年已参与了多个相关项目;在这个过程中,团队看到了用户对于更大存储容量的需求,已从100PB规模发展到300~500PB。

当下,东数西算工程更强调应用的场景化。根据白皮书,温冷数据的“东数西存”,以及更细分场景,比如视频游戏应用所需的 “东数西渲”、AI模型训练所需的“东数西训”等,对存储、算力要求高,但对数据实效性要求不高的应用场景,都将成为“东数西算”未来应用的重要支点。

实际点说,东数西算更关注供需关系。通过对东西部算力、存力等资源供需关系的合理匹配,让“东数西算”融入到各个实际业务场景中,尤为重要。

而“东数西存”“东数西渲”“东数西训”等应用场景,是推动“东数西算”均衡发展的有效途径。

东数西算驶入快车道

存储面临四大转型需求

将算力资源提升到水、电、燃气等基础资源的高度,进行跨区域调配,东数西算倡导的战略价值已被各界认同。地方和产业龙头都采取了行动,表现在成果上,根据工信部数据,截至今年4月东数西算已带动1900亿元新项目,预计到年底这一数据可能达到4000亿元。

根据白皮书,“东数西算”工程的启动实施,将直接拉动新一轮数据中心建设投资,自2022年以来,全国10个数据中心集群中,新开工项目达到25个,新增数据中心规模达54万标准机架。通用、智算、边缘算力节点正在连成“算力一张网”。

张新凤说,东数西算已进入了快速落地的阶段,更丰富的适配场景和更细化、更系统的关键技术的评价指标,都加速了东数西算落地可行性。与此同时,东数西算也对数据中心提出了新的要求。具体到存储层面,张新凤谈到了以下几点:

1、东数西算中CPU、GPU等结合的异构计算较多,对存储要求高。如何打通数据高速共享,提升性能效率,是需要解决的首要问题。

2、容器、云原生等众多新技术及应用落地东数西算,对存储协议提出多样化需求,要求存储供应商提前做好技术布局和支持。

3、作为国家工程,东数西算更强调数据安全,需要存储系统从软、硬件等多个层面上做好国产化等全方位考虑。

4、东数西算对于PUE值要求的比较高,怎么保证存储系统绿色低碳,市面上的产品和厂家还比较少。

这些需求结合起来,实际上为企业入场东数西存设置了不小的门槛。而突破这些门槛,也成为了东数西算驶入快车道需要跨越的技术围栏。如果不跨越这些围栏,必将影响东数西算设施在后续规模化落地应用中发挥应有作用。

算力评估体系,统一算力度量衡

作为东数西算建设的关键一环,算力网络能将多级算力进行整合,结合网络信息和用户需求,为用户按需提供最优资源配置。

汲哲在网络创新领域耕耘多年,对算力网络理解深刻。他表示,算力指的是泛在算力,既包括传统计算的能力,也包括连接算力网络的能力。算力网络目前处在一个相对早期的发展和建设阶段。

谈及建设算力网络在技术层面的挑战,汲哲认为最大挑战是算力评估。统一的算力评估标准体系,可以实现不同参与方之间的高效协同,为用户提供算网一体化体验。“没有统一的算力度量衡,就没办法进行交易。”汲哲补充道。

关于如何建立算力评估标准体系,汲哲分享了他的看法。一方面,业界应该分阶段构建算力评估标准体系:第一阶段基于用户算力需求,综合考虑算力因子、网络因子以及成本因素,得出综合评估结果;第二阶段,算力评估需引入软件服务,建立统一的服务镜像仓库和服务目录,为客户提供算力服务。

另一方面,算力评估需关注功能和服务的统一。首先,算力评估在关注基本功能实现的同时,需考虑安全、容灾备份等服务指标,建立统一标准;其次,算力评估应聚焦应用化、场景化,基于业务场景确定不同评估模型,满足场景适配要求;最后,算力评估应将整网均衡情况、总体社会效益目标纳入算法,实现整网资源利用的最大化。

大道至简,知易行难。如此宏大的算力评估标准体系如何落地是个难题。对此,汲哲提议使用“项目驱动”的方式。在笔者看来,项目团队有明确的共同目标、项目责任人、时间节点和验收标准,如此可量化的操作方式不失为助力算力评估体系落地的良策。

如何打造这条高速“公路”

如何实现超长距离、超高速的传输,满足大量东部地区用户在西部地区进行数据中心存储、AI训练、渲染等算力应用时提出大带宽、低时延传输的需求,成为业界面临的问题。

日前,中国移动联合中兴通讯完成了全球首个400G QPSK准实时系统模拟现网真实参数传输验证,实现49跨段无电中继3038km传输距离,证明了400G QPSK技术实现超大带宽、超长距离传输的性能优势。

中国移动集团级首席专家、中国移动研究院基础网络技术研究所所长李晗对《通信产业报》全媒体记者表示,中国移动将算力网络作为集团最重要的战略之一,以算为核心,以网为根基,构建扁平化、大带宽、低时延的新一代全光网以支撑战略落地。中国移动和中兴通讯在400G QPSK技术领域展开大量深入的合作研究探索工作,后续将进一步将验证结果在实践中落地和推广。

据了解,此次验证为全球首个400G QSPK准实时系统测试项目。在实验室模拟现网光纤长度、损耗和维护余量,基于G.652.D光纤,在部分跨段采用拉曼(RAMAN)技术。

中兴通讯承载网产品副总经理王泰立表示,本次试验除DSP是基于光传输系统实时发送采集数据+离线数字信号处理的形式外,所采用的的光器件和电器件均为商用器件,传输干线距离长达3038km、跨段数多达49跨。其中,大于22dB的跨段占53%,大于25dB的跨段占28%,为应对大量大跨段,混合拉曼放大器数量增至25个,实现了在成为首个模拟现网真实参数设置下传输距离大于3000km的400G QPSK的准实时系统传输。

中国移动和中兴通讯基于400G QPSK调制技术和系统传输能力在两方面做了优化。

首先,QPSK对非线性的耐受能力更高,相比16QAM-PCS可以适当提高入纤功率;背靠背OSNR门限相比16QAM-PCS有优化。另一方面,设置QPSK的通道间隔为150GHz,使得在传输过程中几乎没有滤波代价。以上两方面使400G QPSK在长距传输中优势明显。

其次,在系统传输能力方面,部分大跨段采用EDFA+RAMAN混合放大的配置,噪声更低。采用功率波动控制算法,降低传输过程中总功率波动,系统更加稳定。

光网络是“东数西算”工程基础设施之基,骨干光网对带宽需求紧迫,亟需从100G升级至400G,满足数据中心长距离高速互联需求。目前,业内400G存在16QAM、16QAM-PCS和QPSK三种调制格式,各有优势,适用于不同应用场景。李晗认为,为更好满足“东数西算”要求,就要考虑在距离和效率间做出平衡的选择。

文章来源: 智东西,通信产业报,海峰看科技

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...