中国数据库告别卡脖子之忧:阿里OceanBase霸气卫冕全球第一
晶少 雷刚 发自 凹非寺量子位 报道 | 公众号 QbitAI
中国自研OceanBase数据库,又革新了天下记录。
时隔七月,再次在TPC-C公开证明实力。
但这一次,不只是新晋霸主地位的巩固,也不止于冲破业界尘封9年天下记录后的新里程碑……
更是技能性能benchmark、底层基础自主研发,以及全球尺度话语权的关键事件。
许多年后回溯起来,这还大概是两个时代的分水岭。
数据库、操纵体系和芯片,科技产业和数字化经济中三大当之无愧的底座技能,之前无一项主动权掌握在中国手中。
现在,阿里巴巴、付出宝,十年之功——在数据库领域,冲破全球记录的7个月后,再次创造了新的尺度线。
https://p9.pstatp.com/large/pgc-image/2d1d4ee3494b4224a70e743da69b9f0f
究竟是怎样的成就?
客岁十一,我们就报道过,阿里自主研发的金融级分布式关系数据库OceanBase,在国际事件处理性能委员会(TPC)的TPC-C基准测试中登上榜首。
这一结果还冲破了由美国公司甲骨文(Oracle)保持了9年之久的天下记录,成为首个登顶该榜单的中国数据库产品。
中国工程院院士、计算机专家李国杰都盛赞说:“这是中国基础软件取得的重大突破。”
现在,7个月后,记录再度被革新。
https://p3.pstatp.com/large/pgc-image/01e52a0b4aab4d3f84822d8bd17b56c1
OceanBase不仅冲破了客岁自己保持的天下记录,性能分数首次突破7.07亿,相比客岁大幅提升近11倍。
而且这一次还是扩展本领的展现,在分布式架构下利用高出1500个节点的数据库集群,终极实现了整体性能的大幅提升——这在传统的集中式数据库是无法想象的。
更重要的是,在产业领域,分布式数据库办理了传统数据库几十年的难题,标志着数据库行业迎来了新一轮技能变革。
https://p9.pstatp.com/large/pgc-image/01bebce7979747319f2293702885d4c8
https://p1.pstatp.com/large/pgc-image/f326954410b8428a93e4bc07c30c20b6
TPC-C,被誉为“数据库领域的天下杯”。
是全球主流计算机硬件厂商、数据库厂商公认的性能评价尺度,其对数据库体系的软硬件协同本领要求极高。
也是全球目前最具公信力的联机交易处理(OLTP)数据库的功能与性能联合的测试尺度,金融、电信、当局等关键领域的客户,一般参照 TPC-C 效果来衡量各个数据库厂商的事件处理本领。
更直接来说,TPC-C的测试就是数据库产品真实实力的最佳公开证明。
具体到测试本身,主要涵盖两大方向,分别是根本属性和压力性能。
在模拟真实交易环境并考察数据库根本性能的需求下,要求连续运行至少2小时,通过每分钟创建新订单数量来评价数据库的性能和性价比,规定测试任务需要在指定时间内完成,95%事件在1s内完成。
以是一款商业数据库想要向业界证明自身实力,TPC-C测试,绝对是一项硬指标。
然而,TPC-C排行榜长期被甲骨文、IBM和微软等传统数据库和硬件厂商占据……
中国自研品牌的身影,从未出现过。
直到2019年9月,阿里一鸣惊人,冲破甲骨文长达9年的霸榜垄断。
https://p9.pstatp.com/large/pgc-image/0107606da0ad4ce88e4263de59ec6255
然而当是时,固然结果超第一名甲骨文记录两倍有余,但外界依然有不少质疑的声音,且认为“蹭”了硬件红利。
于是这一次,时隔7个月再战——硬件根本无变革,要的就是技能架构和软件实力的证明。
以是也有外界评价说:「再无对手,独孤求败」。
但参与此次“证明”的阿里工程师体现:这个评价听起来太狂了。
不外也认同,在数据库领域,技能架构的优越和领先,确实短时间内是很难逾越的。
阿里凭什么?
这一次,OceanBase在测试压力性能时被要求连续运行至少八小时,1500多个数据库节点以及5000多万个仓库与对应数量的客户端参与其中,过程中上下抖动情况不高出1%。
以最苛刻的方式,无压力通过了该测试,而且短时间内,别人再以同样尺度通过测试,几无大概。
https://p1.pstatp.com/large/pgc-image/464b5ed96d9c43fdb83c566090493c7c
OceanBase总司理杨冰,分享了OceanBase取胜的核心原因:
分布式整体体系可用性的技能创新。
即不用担心高额的软硬件投入来保障扩展性能所造成的杯水车薪,又可搞定节点故障无法利用主备镜像技能等问题。
以此为出发点,OceanBase大胆采用了Paxos分布式同等性协议,作为整个分布式数据库中最核心的技能之一。
OceanBase首创人阳振坤坦言,无论是主备库数据不同等还是分布式事件的技能缺陷,根本原因都在于关系型数据库自身软件高可用性的缺失,仅仅通过堆砌硬件红利来办理问题显然是治标不治本的做法;而OceanBase则是从数据库内部入手将问题办理。
当然,经过首次打击TPC-C测试乐成再到二次震撼TPC-C并满载而归,期间OceanBase技能团队也做了许多重要的优化升级工作。
例如提供兼容Oracle的租户模式并支持兼容PL/SQL的存储过程;实践分布式并行查询的新执行引擎帮助更好支持TPC-H这类场景测试,更快走向混合负载等。
关于兼容Oracle的工作难点,杨冰强调OceanBase团队的目标是打算用两年时间做到业务的平滑迁移,不需要修改一行代码,也不需要业务做任何调整,但过程中由于Oracle本身功能较多,先去突破哪些具体的内容确实是一种挑战。
https://p3.pstatp.com/large/pgc-image/8b2ca71e68424e93b00eea6574fab03f
另外甲骨文一直以来都是一家技能本领强大的企业,对自身专利权限非常看重,未来在兼容工作进行过程中技能团队认为务必要基于自研数据库的属性对雷同功能的加持保持慎重。
更重要的是,分析甲骨文单机数据库强大的技能功能后,OceanBase团队发现其混合负载是其重要的技能杀手锏,“未来在OceanBase分布式技能架构中实现此项功能的确算是一种不小的技能挑战。”
此外,对于OceanBase来说,公开挑战里的乐成,只是日常实力的证明方式之一。
与诸多中国技能公司一样,业务场景才是最好的练兵场,而且中国业务场景下的挑战,大概比基准测试还要复杂多变得多。
或许你多少有了解,付出宝投身OceanBase获得乐成,除了强大的专业技能人才投入之外,更重要的是阿里经济体与付出宝业务为代表的的互联网规模、金融级场景的复杂度,以及每年双十一大促时期的大型历练机会……
https://p1.pstatp.com/large/pgc-image/99892ee324f94cacaa672d91d02ab4c7
这些都为其提供了自然的练兵场,因为只有经过丰富的业务场景磨练才能证明数据库体系的通用性,“用出来”才是硬道理。
举个例子,在高效办理银行业务从传统Oracle迁移到OceanBase的有关问题时,由于实操经验丰富,团队早已面向开辟者、运维职员等差别技能层面人群提供了完成与大数据链路同步以及异构数据库、同构数据库同步与迁移的诸多工具,例如OCP、OMS等。
现现在随着OceanBase在金融场景的商用化程度越发深入,首创人阳振坤体现,未来团队更想该产品代表下一代分布式数据库的技能趋势前沿与发展方向,在除金融行业以外的多个领域。
例如交通、铁路与航天等也都陆续出现OceanBase的身影,夯实金融场景技能创新之余大力推进商用化进程,逐渐成长位至关重要的通用性技能。
包括现在面目一新的国民应用,目前背后底座就是OceanBase。
以是可以想见,随着TPC-C的再次实力证明,会有更多公司、业务、场景和领域,用上全球领先且中国自研的OceanBase数据库。
在波诡云谲的大环境中,不必再担心任何形式的断供。
https://p3.pstatp.com/large/pgc-image/883731ced28f4d0193d0b4df7a49780f
十年磨一剑
但即便如此,OceanBase一路走来,也并非十拿九稳。
现在看到的是全球瞩目,之前却有十年的风雨兼程。
OceanBase首创人阳振坤回忆,当时完全是凭借技能灵感,认定传统集中式数据库,总会有尽头。
“我固然不是做数据库的,但长期的分布式经验让我以为像Oracle那种单机数据库总会有个尽头。毕竟业务数据量没几个月就要翻一翻,分布式绝对是个机会。”
https://p1.pstatp.com/large/pgc-image/2a83651d39fc4135950e0c9366d95c62
△OceanBase首创人阳振坤
于是当年6月25日,OceanBase正式立项。
又一年,OceanBase 0.1版本正式发布,在淘宝收藏夹上线,乐成帮助淘宝收藏夹业务的数据库服务器数量大幅度减少。
2013年,付出宝开始启动“去 IOE”,即去掉了Oracle数据库、IBM小型机和EMC存储。
2014年付出宝交易库上线,OceanBase产品真正带到金融核心业务。
2017年第一个外部用户南京银行也正式上线OceanBase。
https://p1.pstatp.com/large/pgc-image/f42a22ead4fb44a6b96713c294bd50a5
再到客岁9月,一战成名,冲破垄断。
但更重要的是本年3月,OceanBase宣布正式通过阿里云向全球开放,实现更广泛的高可用、高性能、低成本服务。
而筚路蓝缕的研发之路中,一度因为困难重重、中途因为找不到愿意利用的业务,OceanBase团队还曾经濒临遣散。
现在春风化雨,一切尽付笑谈中。
更重要的是,曾经因为数据库技能垄断,甲骨文首创人拉里·埃里森,让中国互助方在零下二十多度的凛冽环境中苦等2小时的傲慢往事,或许再也不会有了。
现在,我们不仅有了国产自研OceanBase数据库可供选择,而且OceanBase,也是最好的选择。
接下来,就看操纵体系和芯片的了。
https://p1.pstatp.com/large/pgc-image/59720cee953b44cfbd6388442291fed0
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态 据说代码量比oracle少很多,性能方面领先不少,其它方面不好说!现在估计也就他们自己敢用 阿里有功,腾讯死去哪了 可喜可贺,阿里和华为 是中国的骨气 华为放弃自言数据库,阿里宣布新的记录 什么时候用户量第一,就真第一了。 这就对了。赚钱了,搞点基础类研究,打破外国垄断才能不辜负老百姓对你的支持。不要只会赚钱。 马化腾:我们一个月后也有 祝贺阿里在软件领域,尤其是在数据库行业挑战甲骨文取得的重大胜利! 看了这个文章,我觉得阿里确实牛逼,单凭这个数据库,如果发展的好都能撑起阿里的半边天。淘宝庞大的用户体量确实给数据库提供了绝佳的测试环境。国家应该扶持1~2家这样的企业在国际上霸榜。