庞大的数据体量及潜在分析需求,让云原生数据库成为兵家的必争之地。如今的数据库市场,用百花齐放来形容也丝毫不夸张。2020 年,Snowflake 上市,估值高达 700 亿,是老牌数仓领导性企业 Teradata 的近 30 倍。
在 IaaS 层的建设完成后,企业愈发开始关注云对业务带来的价值,因此,大量企业开始重构基于云架构搭建的互联网基础设施,而云数仓的构建与利用,正是大数据时代下企业数据管理能力的缩影。而这种趋势在中国市场更甚,上云的旗鼓未熄,大量企业站在数字化转型的档口,庞大的数据体量及潜在分析需求,让云原生数据库成为兵家的必争之地。“弹性拓展”改造传统数据仓库困境
根据中国信通院数据显示,2020年我国数据库行业市场规模已经达到了240.9亿元。随着云计算的逐步普及,政企上云的需求日益显现。按需分配、弹性扩容等云计算优势,推动着企业对原有的 IT 基础设施、架构及资源进行了重构。 例如,对金融、电信乃至许多互联网行业企业来说,企业数据管理能力关乎生死存亡。海量的数据最终会汇集在数据库管理系统当中,所有上层应用需要调取数据时也是从数据库中查询提取。但相较于应用系统,数据库管理系统处于更底层的基础位置,同时,这个管理系统的效率及性能本身也决定了各应用系统能否运转正常以及运行效率。在国产化浪潮的推动下,去 IOE 体系打破了企业及机构的原有 IT 定势,也让企业数据管理能力的升级及迭代提上了日程。因此,选择一个合适高效的数据管理系统对于企业来说至关重要。早期,市面上类似 Oracle、DB2 等数据库企业,其主要适用领域还是传统交易型场景,实质上它们对于节点及性能扩展、云支持能力都非常差,到 SQL on Hadoop 的大数据时代,以 HDFS 的分布式存储让节点的扩展与兼容性能逐步提升,但面向云的弹性扩容以及性能延展能力仍然较为薄弱。在行业种种痛点亟待解决的环境下,偶数科技便应运而生。2016 年,偶数科技成立,专注于分析型数据库,并自主研发高性能云原生数仓产品 OushuDB、自动化机器学习平台 LittleBoy、数据管理平台 Lava,从底层能力出发,构建企业级核心数仓、数据集市、实时数仓以及湖仓一体数据平台。相比传统的数据库企业来说,偶数科技的云原生架构实现了存储计算的分离,区别于集群内的每个节点存储和计算都捆绑一起的MPP 架构,偶数科技的架构可以让企业对数据的存储和计算资源可以分开管理,从某种意义上来说实现了数据库的“弹性扩展”。利用云原生架构与分析型数据库(OLAP)相结合,偶数让企业的数据管理规模以及上云能力达到了一个新的高度,突破了本地服务器的局限性,大幅提升了信息存储和计算能力。近期,偶数科技完成了 B+ 轮亿元融资,这是继红点中国、红杉中国、金山云之后,偶数科技完成的第四轮融资。 云原生打破数据孤岛
云原生的概念是相对于传统 IT 架构而言的。传统数据库打造的是一个个深井式集群,当一个集群无法承载现有数据时,就再增加一个集群,但放在数据井喷的现在,这些深井之前互相变成了信息孤岛,会爆发出不同集群间信息协同困难、跨集群查询缓慢、数据大量冗余等各种各样的问题。并且,当积累的数据越来越多,节点达到系统架构的承载极限后,数据查询以及处理的速度也会相应的越来越慢,陷入周而往复的恶性循环。例如同一个企业,不同的部门会存在重复存储数据、数据不共享等问题,导致标准功能重复建设,设计标准参差不齐,浪费人力物力,严重的甚至会影响企业的经营,造成无效劳动、资源浪费等问题。云计算的时代,强调数据的共享与打通,基于云架构来构建的数仓,在相同的数据计算量下,可以通过快速拓展计算资源,节省 99% 以上的数据处理时间成本,大幅提升企业查询效率,以实现降本增效。早期的云原生数仓依托于云上无限扩容的基础硬件设施,避免了运维人员在集群规模扩容时的空间困扰,以 Amazon Redshift、Azure SQL DW 为代表,用户可以随时调节集群中的计算节点数量,在云原生度上已经比 MPP 数仓、批处理数仓有了显著改进。但这类数仓数据和计算没有完成分离,当用户对计算资源的需求增加时,需要同时购买计算和存储资源,大大限制了数据资源的有效利用。新一代的云原生数据仓库,通过进一步实现计算与存储的分离,让企业能够实现高弹性扩容、高容灾、低 TCO 的数据管理架构方案,以 Snowflake和Databricks为代表,所有的数据可以可靠、廉价、方便的存储在对象存储上,而这就是现在耳熟能详的数据湖(Data Lake)数仓架构体系。在数据增长很快但计算资源要求不高的时段下,企业只需要增加存储节点,不用浪费计算资源的成本;而当企业面对临时增加的数据计算或查询需求时,也可以利用云原生的架构优势,迅速增加计算资源。通过自身在架构层面的优势,偶数科技已经和一大批企业建立起了深度合作。在银行领域,偶数科技深度服务浙商银行、中信银行,并与全球信息存储规模最大的建设银行,共同成立了高性能大数据处理技术实验室,构建数据湖;在电信领域,偶数科技的数据库系统OushuDB已在联通十多个省份上线,实现了数据的实时和准实时分析;在家电消费品领域,如海尔等企业,也开始在用户画像雷达等方面与偶数展开合作。 以浙商银行为例,常雷博士透露,在早期,浙商银行也曾试用过Oracle、DB2以及 Hadoop,不过,现在浙商银行已经将所有的数仓应用场景都放在了偶数云数仓,从原来的多种数据库组成的解决方案,升级成了基于OushuDB的全行级数据平台,大约有100 多个节点。从效率上来看,在使用偶数云数仓后,从以前接近一天才能跑完的任务现在只需7、8 个小时就能跑完。2018年8月22日,全球著名软件基金会Apache®正式宣布:Apache®HAWQ®毕业为顶级项目(Top-LevelProject),成为首个由国人主导研发的Apache数据库顶级项目。承载着中国心和中国的科技力, HAWQ及偶数科技的创始人常雷博士与他的团队仍在不断磨砺和贡献自己的技术力量,推动数据库行业的发展与壮大。关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/