美国数据库败退,百亿国产数据库如何淘金?

首席数智官 2022-04-15

大数据开源中国分布式数据库

3971 字丨阅读本文需 8 分钟

来源:@首席数智官(ID:shouxishuzhiguan)

hello 大家好,我们是首席数智官,研究产业数字化已经10年。

在长期的工作中,我们一直试图寻找「新品牌是如何借助数字化技术实现快速崛起」的答案。

为此,我们走访了大量知名企业,与上千位技术专家、创业者、前辈同行等一线精英们交流学习,看他们是如何利用数字化技术来创造新的商业机会,打造新的爆款产品。

我们希望把这些技术影响商业创新的案例分享给你们。

关注我,每天给你讲一个商业案例。

今天我们要给你讲的是:如何掘金百亿规模的国产数据库市场?

中国数据库市场已经步入百花齐放、活跃创新的新阶段。

据艾瑞数据统计,2020年中国数据库市场总规模达247.1亿元,同比增长16.2%。

受国产化影响,2020年国外数据库厂商的市场份额下降至52.6%。

需求端,数据库国产化和企业数字化转型的浪潮带动了中国数据库产业的爆发式增长;

供给端,在经历了多年的积累和打磨后,国产数据库厂商市场版图快速扩张,国产厂商厚积薄发,产品和技术逐步走向成熟。

近年来,分布式数据库在全行业备受关注,该品类也已经成为了解决单机性能有限条件下,数据量快速增长的最佳解决方案。

日前,我们与巨杉数据库产品及运营资深总监萧少聪交流,进一步解析了数据库市场和分布式数据库的市场前景。

巨杉数据库成立于2012年,核心团队来自IBM DB2、华为。

10年来,巨杉数据库聚焦自研分布式数据库内核,产品已经服务于超过1000家企业。

在对数据库安全性、稳定性、性能有着最高要求的金融行业,巨杉数据库已在超过100家金融银行规模化生产上线,最大单集群部署规模达300台服务器、超过3PB数据容量、1.2万亿行数据规模。

01 中国数据库迎来新增量市场

数字经济是继农业经济和工业经济之后,以数据作为生产要素的新经济运行模式。

农业经济时代,土地是生产要素,锄头是生产工具;

工业经济时代,能源是生产要素,发动机、引擎是生产工具;

而数字经济时代,数据是生产要素,数据库就是生产工具。

数据库产业诞生至今,经历了三代发展。

在过去40年间,数据库更是基础软件中营收最大的行业。

第一代数据库是集中式的,主要用于处理“电子信号”,通过将电子信号存储转换去快速响应预警问题,也是工业自动化需求的产物。

第二代数据库依然是集中式的,如Oracle、DB2、MySQL及国内的达梦、人大金仓、openGauss等都属于第二代数据库,代表的是自动化到信息化的转变,基于信息化背景,推动经济突飞猛进。

第二代数据库主要用于处理“业务结果”,保存的是业务结果数据。

为什么不能把过程数据保存下来?这是由于当时的科技能力尚未到位,集中式的数据库缺少分布式的扩展能力,存储量有限。

第三代数据库是分布式的,主要特点是可以处理“全量数据”,也是迈向数字化的开端。

第三代数据库最重要特点是可以保存更多的数据,可对数据库进行分布式的扩展管理,使得存储容量叠加、计算能力叠加。

这样一来,就不单单只能保存以结构化为代表的结果数据,还可以保存如半结构化数据或非结构化数据等全量的过程数据,数据的类型变得更多了。

早在10年前,Oracle一统天下的时代,业界一度认为数据库这门生意已经走向尾声。

但数据库的发展离不开本身大环境的发展,近年来,移动网络、5G、IoT的蓬勃发展使得市场春风再次吹向数据库行业。

我们认为,数据库这门生意出现了新的增量市场,并且远远没有达到饱和。

过去的数据库创业,关注的是去IOE、替代IOE的商业故事。

今天的数据库创业,建议可以更关注增量发展,从服务于结构化数据的业务走到服务于半结构化、非结构化的全量数据业务。

举一个简单的例子,过去的银行需要去柜台办业务,是人与人的业务交互,数据量少。

很快,我们演进到了人跟ATM机进行频繁的业务交互。

再进一步,人开始通过手机、PC去和银行进行交互。

数据量和交易频次呈指数级上升。

未来银行,bank4.0将可能进入API跟API之间的自动交互的时代,数据量的增长更是难以预估。

市场调研报告数据认为,到2024年全球的数据库产值将达到1000亿美金。

另外,中国自身的人口、数据基础优势,也将在增量市场发挥出巨大的市场前景。

巨杉相信,数据是未来数字经济的生产要素,全量数据不仅仅是结构化的数据结果,也应该包含由各类结构化及非结构化数据组成业务过程、流水、音视频等对象数据。

因此,价值的释放不仅仅是离线分析,更应该是为全量数据提供实时对客服务的能力。

让每个业务用户可以随时获悉自己在数字化社会中对数据业务过程的处理全貌,提升让数据实时可见,释放全量数据价值。

02 如何打造数据库创业护城河

当然,在今天的市场上,存在大量关于集中式数据库、分布式数据库谁能笑到最后的讨论。

集中式数据库大多是在垂直的、单节点、单台机器中集中运行、存储。

集中式存储设备跑的是服务器内部专用总线,特点是延迟低。

分布式的数据库是通过网络将数据各节点连接形成更好的扩展能力。

因此,分布式数据库更适合于海量数据存储、应用,尤其是在高并发的查询业务中,可以实现更平稳的扩展、性能更平稳地扩充。

作为第三代技术,分布式数据库被赋予了“去O”、燃起分布式“革命”的重大使命。

实际上技术发展总是螺旋式“迭代”前进的。

从历史的演进方向看,分布式数据库最终可能会逐步替代集中式数据库,但这不意味着集中式数据库会走向灭亡,我们更笃定迭代的规律,而不是替代的规律。

集中式数据库能解决一些分布式所解决不了的东西,比如延迟。

集中式一定会比分布式延迟低、更快捷,除非网络的延迟与服务器总线的延迟相当,集中式数据库才有可能走向终点。

如一部分银行客户的业务,既需要用集中式满足更好的延迟需求,又要用分布式数据库去处理全量数据。

第三代分布式数据库不应该仅仅考虑对第二代集中式产品的替换,而是应该面向新的“全量数据”的场景,成为可以给客户提供释放数据价值的数据基础设施。

10年前大家可能不理解,但伴随数字化,全量数据容量及价值空间已经呈现。

从市场的验证看,巨杉没有“卷”入“去IOE”的替换大潮,而是聚焦于解决“全量数据”的场景;

与客户在创新的数字化场景下,解决了原来第二代数据库无法解决的扩展性问题。

同时,也解决了传统数据仓库及大数据无法支持的实时高并发精确查询问题,为客户的业务带来全新的价值,而不仅仅是原有产品的替换。

另外,我们数据库创业的经验就是去做减法,一定要聚焦。

一是聚焦客户需求,真正为客户创造有效价值;

二是聚焦长期增量的市场创新;

三是聚焦坚守创业初心。

做数据库,并不是将一堆技术大咖聚集在一起这么简单;

也不是做的时间越长,最终就能存活下来。

数据库不像互联网只争朝夕,数据库这类基础软件生意是非常长线的生意。

最难的是要在做产品的同时选中一个真正有效的远景方向,选中了方向以后坚持积累并做下去。

看清楚了,扎实地抓进去,一定能够做出来一个结果。

当然这尤其考验创始人的经验。

当前一部分客户的短期需求是去IOE,要去满足客户去IOE需求,就不得不做各类Oracle兼容性,及很多第二代数据库已经做的很好的重复开发。

其实最后会发现,消耗了很多精力,而无法聚焦的可以对客户带来长期有效价值的增量创新。

因此,我们要学会做减法,想清楚远期目标是什么。

总的来说,0-1阶段,是选中方向,坚守企业路径的阶段。

1-N阶段,企业应该聚焦于客户共创,去解决传统产品无法解决的问题。

另外我们的经验是,客户在选择数据库产品时,性能、稳定性、性价比和服务、标杆案例都是关键指标。

因此,对于数据库创业者而言,业界的口碑和产品的稳定性以及整体行业契合度是至关重要的。

03 软件开源热潮下,数据库创业一定要走开源路线吗?

在今天,开源和闭源都是非常成功的数据库商业模式。

得益于开源,今天数据库软件创业的门槛降低,开源的好处是通过开放,让大量的市场人员得以使用,然后基于大量的用户使用以后,进而转化为最终的使用用户。

开源与否的讨论背后,我们应该仔细理清用户和客户两个概念。

我们通过开源可以很快速地积累用户,然后漏斗成为最终付费客户。

但是如果企业本身对于数据库市场已经非常了解的时候,并不一定需要通过这个方式。

开源模式,主要聚焦于快速通过技术爱好者生态的低成本传播打造产品,以漏斗形式留存付费客户。

闭源模式,主要聚焦于付费客户的商业诉求打造产品,获得付费客户认可后,建立需求驱动的技术群体生态。

一个产品到底应该选择哪一种模式,取决于创始团队的基因。

如果创始团队已经具备了成熟的企业级产品基因,对市场发展有足够的洞察并聚焦在明确的目标上,那么应该选择闭源的企业级商业模式,可以使得团队资源更有效地产生商业价值。

因为企业资源永远有限,商业上我们应该要将有限的资源投入到客户付费认可的功能当中。

如果创始团队是互联网基因,希望达到快速的技术传播,希望探索市场需求形成商业漏斗,那么可以选择开源商业模式。

其起步成本低,作为对赌其有效商业变现的周期更长,同时企业资源需要投入到持续扩大爱好者,迎合他们的探索需求,存在资源投入后无法形成付费价值体现的风险。

当前的国内开源热潮的确存在较大泡沫,我们应该重新聚焦产品商业化能力本身,而不是仅仅讨论开源与否。

数据库市场估值最高的IPO企业Snowflake其产品并没有开源;

Apple的操作系统iOS也没有开源;

包括开源业界备受追捧的Redhat已经停止了CentOS;

各类开源数据库MongoDB、Redis、Elasticsearch也陆续修改其开源协议以避免在商业上被竞争对手滥用导致开源社区的“内卷”商业竞争。

所以,最终判定是否成功,还是需要看产品是否获得商业化的认可。

回归到产品,我们应该关注产品是否为客户带来了商业价值,而不是仅仅看GitHub的Star数量或社区玩家数量来判断是否“繁荣”。

总的来说,数据库一定是一门好生意。

未来人类对数字化经济的想象有多高,数据库的天花板就有多高。

中国作为发展增速最快的经济体,将引领全球数字化技术发展。在金融科技、抗疫、智慧城市领域均走出了中国模式,对全量数据提出了更高的实时处理要求。

聚焦中国市场的业务需求,才能打造出更具差异化的产品,影响全球技术发展。

互动环节

Q:在大浪淘沙的创业的环境当中,能够活下来的公司需要具备哪些必要的条件?

A:技术的创新非常重要。第一个就是创始人的团队有没有一个非常明确的在数据库的某一种细分,或者说是某场景里面可以打开一个缺口,这是第一点。

当打开了这个缺口以后,跟客户形成一线去解决客户有价值的需求,并且总结形成满足行业共性需求的产品。

Q:目前国内对于外国的软硬件技术在哪些方面依赖度会比较高,哪些角度上替代起来会比较困难?

A:现阶段硬件依赖度高。在核心能力上,还是相对比较欠缺。

另外做基础软件,再过10年,最后拼的还是人。

以数据库为例,业界非常缺少具备深厚功底的人才,而这些人才不单只是靠工业界产出,还需要学术界一起去推动。

-END-

你听说过数据库吗?欢迎在评论区留言告诉我们。

如果你觉得本文有价值,欢迎点赞分享收藏。

如果你想进一步与我交流,欢迎随时私信我。

关注@首席数智官(ID:shouxishuzhiguan) 看精英们成功的商业方法论

p.s.我也会回关你噢

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:首席数智官
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...