读懂“融合数据云”,看中国数据基础软件从并跑到领跑

云报 2022-04-28

大数据科技星环科技

2928 字丨阅读本文需 7 分钟

中国在数据基础软件领域,正从并跑迈向领跑!

这首先要感谢这个时代,因为在“数据驱动一切”的数字经济时代,数据价值的释放离不开先进、高效、与时俱进的数据基础软件平台;其次,国务院在《关于构建更加完善的要素市场化配置体制机制的意见》中将数据定义为继土地、劳动力、资本、技术之后的第五大生产要素,这相当于为数据基础软件市场的加速发展打开了“闸门”;再次,对于企业用户来说,数据不仅仅是生产要素,更是能够带来增值和创收的资产,因此构建数据基础软件平台刻不容缓;最后,对于中国创新创业的数据基础软件厂商来说,新技术的演进迭代、行业客户的迫切需求、国产化替代的使命,都成为其锐意突破的动力,也为实现从跟跑到并跑再到领跑创造了理想的环境和难得的机遇。

生于大数据时代的星环科技,其实从诞生之日起,就在与国内外一众数据基础软件领域的精英们并跑,其创新的理念与产品丝毫不逊于友商。2022年4月19日,随着“融合数据云”的首次提出,星环科技在数据基础软件这一赛道上持续领先一个身位,领跑的优势正逐渐显现。

“并跑”打下的基础

如果按时间来划分,从公司成立到2022年之前,星环科技都处于与业界并跑的阶段。参加跑步比赛的人可能都有体会,无论跟跑、并跑还是领跑,其实都是一种策略。但是并跑更特殊一些,不仅需要跑者自身具备极强的速度和耐力,而且要时刻注意身边其他的并跑者是否会随时调整技战术,然后再随需应变。

对于星环科技来说,并跑既是客观现实,也是公司一种主动的战略选择,通过一段时间的并跑,可以深刻洞察行业发展趋势,准确把握用户需求,同时建立并逐步完善公司的产品体系及技术架构,不断增强自身的“体力和耐力”,为下一步冲出并跑大团队、实现领跑打下基础。

2013年,星环科技成立的第一年,便发布了Data Hub数据枢纽,为公司的大数据产品奠定了基调。一方面,它与传统的集中式的数据分析模式一脉相承,而另一方面,它又进一步强化了数据的存储、分析、分发、共享,其功能与定位与之后被业界热炒的“数据湖”相近,可谓异曲同工。

此后几年,星环科技在数据分析模式方面做了更多深入思考与实践,创新成果层出不穷。2017年,大数据3.0概念的提出是一个里程碑,它颠覆了过去“铁路警察各管一段”的运用离散工具处理数据的方式,在星环科技“一站式”数据平台将数据湖、数据仓库、数据集市一体化,并提供一套数据工具集——Transwarp Studio,实现从数据采集、数据治理、数据质量提升、形成数据资产直到数据对外服务的覆盖数据全生命周期的处理而声誉鹊起。

需要注意的是,在这个阶段,数据处理的方式虽然变了,效率提升、操作简化,但是Transwarp Studio仍然是星型结构,Data Hub枢纽的地位不变,所有数据都会汇聚到Data Hub中进行处理。

2018年应该说是具有转折性意义的一年,从当年数据云(Data Cloud)的发布可以看出,星环科技已经具有了国际视野,以及对整个行业发展趋势的前瞻洞察。在云计算开始大规模应用的背景下,大数据与云计算、AI等技术的融合交织,将数据处理和分析推进到一个新的阶段。基于此,星环科技推出了融合云计算、大数据和AI技术的数据平台,即Data Cloud。它具备统一的资源管理技术,并且是基于容器技术实现的;它对外弹性提供数据库作为服务,就连AI建模分析也作为一个微服务向外提供;它还为应用打造了一套DevOps平台。

Data Cloud的推出建立在星环科技对数据更深刻的认知基础之上——应用基于数据而生,数据更重,应用则较轻,应用要随时按需留存。正因为Data Cloud的提出,很多人将星环科技与全球最红的数据独角兽Snowflake相提并论,这也引发了业界对星环科技和Data Cloud更广泛的关注。

按星环科技CEO孙元浩的话说,Transwarp Data Cloud 1.0已领先同类产品一代。也正是从Data Cloud推出开始,星环科技身上已经渐渐显露出领跑者的一些特质。

特别值得一提的是,在星环科技Data Cloud中,无论是机器学习,还是数据处理、统计和分析,都可以用统一的计算引擎分布式架构来实现。从集中到分布式,星环科技在技术上完成了一次蜕变。

2020年,多模型数据平台发布,这时的星环科技已经站在业界的前沿,其技术和产品研发具有开创性,正以引领的姿态推动整个业的创新。

所谓多模型数据平台,就是用统一语言、计算、存储、资源等,重构大数据软件栈,在一个平台上支持十种数据模型,从而有效降低数据开发与运维的难度,极大地提升用户的开发效率。正是因为多种数据模型被融合在一起,访问语言也随之产生了革命性的变化,SQL语言可以拓展、延伸到不同结构的数据。人们能够用同样的语言访问不同数据结构,而统一的多模平台可以支撑更多新应用的产生。

从Data Cloud到多模型数据平台再到后来的联邦云,星环科技在数据基础软件领域的创新不仅速度越来越快,而且独创性日益突出,领先的优势也一点点积聚、扩大。

从2013年到2021年,从星环科技的技术和产品创新路径来看,经历了由点(Data Hub)到线(一站式平台)再到面(Data Cloud)的深化与演进,不仅整个产品体系越来越完善,而且对数据的理解越来越深刻。数据是核心、是驱动力,只有从数据的角度出发,才能找到解决应用痛点的症结,才能产生一些奇思妙想,甚至是颠覆性的理念和做法。同时,不管技术如何变化,“简化”永远都是草蛇灰线,伏延千里,引领着创新的方向。从星环科技的大数据一站式平台到多模型数据平台,其实都是为了简化大数据的访问和运维,这也是对用户最大的吸引力。

另一个不能忽视的点是,从最初的Data hub到后来的Data Cloud,数据分析模式已经从集中式慢慢转向了分布式,这实际上为融合数据云的推出做了最好的铺垫。

融合数据云 尽在“网”中央

融合数据云的发布,是星环科技实现全面领跑的开端。

所谓融合数据云,是指在按数据域组织的分布式数据云的技术架构基础之上,进行统筹管理、协同运营、服务融合,以形成协同一致、自由组合、灵活部署的一种新型数据分析模式。

“在融合数据云时代,数据连接一切。”孙元浩表示,“数据就如同血液一样,能够以安全、可信的方式,即时流动到合适的地方,为需要的人所用。”

业务的协同化、分析的平民化、数据的领域化推动了融合数据云的产生。“融合数据云旨在兼容不同的数据领域,提供更方便的分析模式,协调不同的业务。”孙元浩表示,“通过融合数据云,我们希望更有效地促进数据的流动;通过统计分析和决策智能赋能业务的智能化,充分发挥数据的价值;融合多种数据领域,通过联邦分析、多模型存储平台,将数据的关联价值发掘出来,将数据和应用部署在不同的IaaS上,实现联邦化。”

融合数据云拥有四大典型特征。

第一,自由流动性。只有流动的数据才能产生价值。融合数据云以数据主动流动的方式,取代了以往数据被动采集入湖的方式,大大提升数据分析的效率。数据流动的前提是建立安全可信的基础和环境,从而确保数据可以流动到正确的地方,被对的人所用。

第二,开放与共享。数据只有开放和共享,才能实现价值最大化。促进数据的交易和流通,已成为推动生产力发展的重要因素。

第三,分析轻量化:按需生成和随时部署的需求,使得分析越来越轻量化。这就需要统一的语言和应用开发方式。

第四,统一纳管:融合数据云可以横跨企业边缘端、私有云、公有云、混合云等,覆盖传统数据库和现代数据平台架构,能够按需调动底层资源,更好地承接上层的数据应用。

融合数据云的部署方式是网格结构,它由各自独立又可以自由组合的“数据域”组成。企业可以根据云边端等数据资源环境、时序/对象/图片/文档/图数据等企业数据模型、湖仓集等存储结构,建立三维立体的数据域,从而构建企业级的网格结构,为数据的流通开辟合规的路径,奠定价值创造的基础。

融合数据云的网格结构是数据流动的基础。数据存储于多模型的数据库中,而每个据域都具备部署、模型、分析、智能等多种属性,通过互联管控实现协同工作和数据流动。数据在各数据域间的流动提升了数据价值的活跃度。

孙元浩表示,汇聚在融合数据云中的数据,可以在不同的数据平台间即时流动,从低到高,为企业创造数据价值;从高到低,为企业的分析应用部署提供应需而变的响应速度。

高擎融合数据云的旗帜,星环科技此次更新、升级了几乎所有的产品线,包括TDH 9.0、TDC 3.0、ArgoDB 5.0、KunDB 3.0、StellarDB、4.0 Sophon 3.1等,不一而足。进入融合数据云时代,星环科技开始加速领跑。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:云报
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...