CSDN 发表于 2021-8-12 17:51:48

十年比肩?看国产数据库如何突出重围!| 新步伐员


长久以来,怎样“去IOE”不仅是数据库产业的热议话题,更是国产数据库厂商纷纷致力的方向。但事实上,想要通过核心技术弯道超车几乎是不大概的。但在国家整体规划逾趋清晰下,进一步完善人才机制建设,不断加强市场培养,将来依然可期。

作者 | 杨阳
出品 | 《新程序员》作为核心技术“三大件”之一,数据库在中国的发展可谓龃龉前行。1978年,中国人民大学经济信息管理系创建人萨师煊提出了发展数据库的理念,并在1979年汇集成《数据库系统简介》和《数据库方法》,成为我国最早的数据库学术发蒙读物。
20年后,国内第一家数据库公司人大金仓建立。据人大金仓总裁杜胜介绍,人大金仓之以是有“人大”两个字,是因为从人民大学信息学院中脱胎而来,“金仓”则原本是信息学院的一个研究课题。
“数据库门槛太高,国外很早就已经发展成熟,各人都知道在这个范畴投资会赔钱,以是当时没有人投。后来是人大的老师们凑了50万元一起开办,才有了今天的人大金仓。”
【小提示】点击下方查看专访视频

从数据库概念的提出,到产业化的落地,都是自“人大”开始。本期《新程序员》与人大金仓总裁杜胜,就数据库的技术演进逻辑、产业的发展周期,以及核心研发人员怎样培养等方面进行了深入探讨。
https://p6.toutiaoimg.com/large/pgc-image/SfrixTq92Xbipu
人大金仓总裁杜胜
杜胜,北京人大金仓信息技术股份有限公司总裁。拥有近20年IT行业产品设计、研发及上市管理经验。曾主导慧点科技GRC.platform、indi.Mobile、GRC.mobile、indi.platform等产品的设计、研发及上市,历任企业管控事业部总经理、通用产品事业部总经理、公司副总裁。


https://p3.toutiaoimg.com/large/pgc-image/SNITKRIBqnnhoh
业务逻辑趋向应用端,数据库集群并行运算


《新程序员》:颠末数十年发展,数据库技术不断迭代更新,从File情势存储到层次型数据库,再到关系型数据库……你是在哪个阶段进入到这一范畴?后续发展呈现怎样的特点?
杜胜:我是在关系型数据库时代切入到这个范畴的。应该说我们现在看到的大多数数据库应用都是关系型场景。关系型数据库最早是基于传统C/S架构,比如20年前我们会用PowerBuilder,或者Delphi这类语言去做客户端的显现。
一样寻常前端很少写业务实现逻辑,它的实现主要通过数据库来进行运算。当数据库在存储过程中把逻辑实现后,再通过前端按钮触发逻辑运行。
对于早期应用来说,数据库是核心。大量的应用逻辑是基于数据库的PL/SQL语言来开发的,一是这样的语言作为脚本语言学习难度低,容易上手;二是数据库能够提供非常多的功能扩展包,资助应用快速实现功能,比如要完成某个递归算法时,通过数据库中的一个函数就可以完成。如果是我们自己编程,代价就会高很多。从关系型数据库时代开始,数据库就成为了应用中不可或缺的一部分。《新程序员》:从数据库发展历程来看,演进的逻辑是什么?
杜胜:关系型数据库之以是登上汗青舞台,主要在于它对应用的支撑作用。传统C/S(Client/Server)应用,Client端模式非常简单,更重的落脚在Server端,Server对于数据库来说是至关重要的部件。后来,应用从C/S演变到B/S(Browser/Server),出现中间件,一些逻辑就开始往中间件迁移。当然,还有部分应用依然没有摆脱C/S架构的特点,依托数据库完成业务逻辑计算,但当中间件发展到肯定程度后,逻辑开始向应用代码中迁移。
再到将来云原生的模式,用户对应用的投入越来越高,对数据库的依赖则在降低。整体上,数据库更多在于提拔伸缩性和弹性,以应付更大的并发量和负载压力。以是,数据存储和吞吐本领整体在提拔,业务运算方面则在弱化。
包括现在讨论的分布式数据库,更多是基于数据的存储,运算基本放在应用端来实现,这是应用整体架构的变化带来的。架构的变化基于应用场景的变化,是应用在驱动我们的底层厘革,数据库实际上是被动跟随。《新程序员》:不停以来,数据库行业都在讨论怎样实现技术“去O”,你认为该怎样实现?
杜胜:已往有两个说法,一个是“去O”,一个是“替O”。这是两种思路的差异,“去O”主要因为Oracle充足复杂,很难取代。那么,就从应用的角度入手,让应用端负担更多的运算,从而制止使用Oracle的复杂本领,绕开它。我们当然可以用应用代码来编写业务逻辑,比如用MySQL开源数据库来满足需求,但这样的话,全部的应用都必须重写,不能再利用汗青资产,相当于重构一个新的体系。
另一条路径是“替O”,延续原本的规则和体系,依然使用存储过程和函数。“替”的含义在于让国产数据库产品具备同等本领,从而替换Oracle。
相较而言,“替O”路径对于应用厂商而言成本更低,因为“替”的过程实现对于应用厂商来说更容易,客户的汗青资产能够得到保存。对于一些传统企业和党政客户来说,尽大概利用汗青资产是最优选择。但在互联网范畴,对成本不是很敏感,一样寻常会选择“去O”。
当然,随着云原生的发展,新的技术路线也在演进。将来数据库的使用会更加偏向目前互联网的模式,我们会在应用中实现更多业务逻辑,从而降低对数据库的依赖,这是一个大的趋势。《新程序员》:从“数据库”到“数据仓库”,只是一个字的变化,看上去只表现在量级上的差别。你认为从“库”到“仓库”之后,有哪些延续了?有哪些升级了?
杜胜:从数据库到数据仓库的变化主要基于社会信息化程度越来越高。
在早期,数据库能够办理交易和分析两方面的问题。但近三十年来,信息化徐徐兴起,随着数据量的不断积累,我们遇到了两个问题:第一,数据存储遇到挑战,设计的容量不够,需要把它扩大;第二,有了这么多数据之后,该怎么用?数据自己没有任何价值,只有把它们用作分析、统计或者运算才故意义。
要办理数据容量不够和数据处理不足这两个问题,在单点的运算本领难以支撑下,就需要构建大的数据库集群,进行并行运算。
我们有一款名为KADB的产品,是用MPP技术来实现的分布式数据库,可以实现大规模并行处理。通过并行运算,原来一个单机两到三天才气运算出的结果,构建100台集群后,几分钟之内就可以把结果计算出来。因此,从数据库到数据仓库不仅是量的变化,我们要面对的场景更复杂,处理本领也需要极大提拔。《新程序员》:目前产业还面临哪些广泛的技术困难?
杜胜:在传统范畴,共享存储集群还是非常困难的技术。对于数据库软件来说,稳定可靠是第一位,如果这个问题没有办理,其他都没故意义。但目前来看,只有Oracle能做到这点。
虽然我们想要弯道超车,但这类硬核技术的研发几乎是不大概的,同时也不太大概用某种新技术来代替。无论软、硬件,底层技术的要求都非常高,很难通过走捷径办理,只能一点点消化、学习,希望市场能够给我们沉淀和试错的时间。


https://p6.toutiaoimg.com/large/pgc-image/SdjMPuI9HbkPe1
数据库产业处于成长期,产学体系仍需优化


《新程序员》:相较于AI、物联网、云计算等动辄万亿产值的技术,数据库在从前没有被追捧,但比年资本也徐徐涌入这个范畴,为什么会掀起这样的高潮?
杜胜:确实,如果放在前些年,人大金仓想要在资本市场获得关注是很困难的。但最近三年我们发现,资本对数据库产业的关注明显提拔。近期有几产业业链友商获得大额融资,最多的获得了2.6亿美金。这在已往是不可想象的,说明现在国内态势正在变化。
为什么会出现这样的趋势?说白了就是核心技术要掌握在自己手里,才气从根本上保证产品的自主可控。
在全球化时代,看似全部东西都能买到,但关乎到核心技术和核心理论,还是存在广泛的掩护主义的。这对于我们即将开启的数字化转型无疑是坏消息,整个经济都要构建在数字底座上,我们买不到就只能自己做。以是,这个节点上,资本投入数据库范畴也是情理中。《新程序员》:从产业周期看,你以为国内数据库是处于成长期,还是已快到成熟期?
杜胜:我个人感觉还是在成长期,我们评价产业发展阶段有一个标准,就是产业从业人员,尤其是核心技术从业人员可否支撑产业的可持续发展。很明显,我们在核心技术人员的储备上严重不足。再从市场来看,自2001年中国加入WTO,国外品牌纷纷进入中国,二十年已往了,依然占据大多数市场份额,把持是不停存在的。
在现象背后,是后进者与先辈者的汗青差距。Oracle 1977年建立,人大金仓1999年开办,尽管是国内最早的数据库公司,但还是落后了22年。
当然,我们走向成熟也指日可待。一方面基于国家层面的规划;另一方面,最近几年涌现出200余家数据库公司,这是非常好的现象。虽然短期大概有泡沫,但行业做起来会吸引大量人才,大浪淘沙后优秀者自然会留下,行业也会徐徐走向成熟。《新程序员》:在硬核技术范畴,你以为很难“弯道超车”。但面对这样既重要又困难的现实,产业界通常又寄希望于有这样的弯道,对此,你认为该怎么办?
杜胜:需要从两个方面来说,一个是技术的底层逻辑, 一个是人才和市场。
首先,做基础软件需要端正心态。在整个产业链上,已往做得好的是应用,比如淘宝、美团、抖音等软件,满足了客户需求并持续深耕,就能在市场中下沉。
然而,基础软件开发有客观规律和周期。比如,目前我们的高等教育、研究与产业界之间仍然不能紧密衔接。学校的老师大部分是本、硕、博“直通车”,上完学就回到学校教学,很少有在产业界扎根的经历,学校和产业是脱节的。怎样达成人才培养闭环和产业闭环?可以借鉴一些成熟的经验,比如国际名校的很多老师曾是产业界的高级经理人,或者是技术人员。他们退休后利用闲暇回到学校,将产业中遇到的困难和研究方法传授给弟子。这样,理论可以有的放矢,产业界的实践也通过大学的进一步研究而系统升华。我们的学校也开始有这样的趋势,但还需要持续发展形成闭环。
其次,每个人有差别的个体天禀,我们的弟子也都非常聪明勤奋,现在世界上很多知名科学家都是华人。从主观能动性的角度,我还是相信整体的学习氛围能让我们在某些范畴赶超,然后带动其他范畴。
再者,以人大金仓的经历来看,市场也是转折的关键。在建立的前十年我们发展比力慢,国外软件几乎没给我们留什么机会。09年被中国电科收购之后,我们加入了“国家电网核心电力调度系统”这个项目,通过这个系统应用获得的良好声誉,让我们的产品和服务打开了市场。
以是,技术落地要符合客观规律,还需要在体系建设上持续优化。从人的主观能动性和市场培养角度,我以为还是有超越的大概。将来十年,我们希望进入国际市场,再过五年,或许可以做到世界领先。


https://p3.toutiaoimg.com/large/pgc-image/SdjMPug8ywO11K
DBA与核心研发人员的培养


《新程序员》:对于数据库核心研发人员的培养,人大金仓是通过怎样的方式来培养?
杜胜:我们现在的人才体系有两类:

[*]第一类是数据库的使用人才,就是常说的DBA,培养核心是怎么使用和维护数据库。这类人才的培养相对容易,美国数据库软件公司已经帮我们培养了很多人。对他们来说,在我们这里的学习不是从0开始,而是“再学习”。在共通的数据库技术下,他们转换很快,可以把以前Oracle、Db2、SQL Server等的DBA很快转化到国产数据库,这样就多掌握了一门技术。我们现在面向全国开设免费学习课程,包括KCA、KCP、KCM,国外这类课程都是收费的。对于我们来说,为产业培养人才不是为了盈利,是为了让生态快速建立起来。
[*]第二类是核心研发人员,这类人才培养非常困难。就目前情况来看,中国有非常多的程序员,但做数据库内核研发的只有一两千人。以传统师傅带徒弟的自然培养方式显然是不够的,我们要把人才体系真正建立起来。目前国内开设数据库相关课程的高校只有二十多家,我们已经和人民大学、武汉大学、山东大学合作开发课程,增设了数据库内核专业。
《新程序员》:你要“从IT应用软件产业中寻觅人才”,《新程序员》的核心受众正是巨大的软件开发者群体,你对开发者有什么要说吗?
杜胜:如果细致观察,我们不难发现做数据库的都是国际巨头,像2019年排名前五的数据库厂商:Oracle、微软、AWS、IBM、SAP。事实上,做系统类软件才气在全球通用,以是这个市场量充足大。假以时日,我们国产数据库真正成长起来,彼时遍布全部行业,那肯定会成长为巨头公司。如果看好数据库,想让你做的软件被世人铭刻,那就加入我们!本文出自《新程序员·新数据库时代&软件界说汽车》,即将正式上市!


2018年图灵奖得主、深度学习三巨头之一Yann LeCun(杨立昆),2020年图灵奖得主、龙书《编译原理》作者Jeffrey Ullman,英特尔副总裁Erez Dagan,阿里巴巴团体副总裁李飞飞,腾讯自动驾驶总经理苏奎峰……《新程序员》第二期,我们以「软件界说汽车&新数据库时代」为主题,邀请到国内外60余位学术领航人、技术大咖与产业先锋,为智能驾驶及数据库产业奉上酣畅淋漓的理论交锋及实战演练。
何谓新数据库时代?需要从已往和现在看将来。在“十问数据库”中,华东师范大学副校长周傲英、达梦数据库副总经理冯源、TiDB首创人黄东旭、OceanBase CTO阳振坤……各路产学研大神齐聚,从数据库国产化汗青,到开源、云,再到数据安全,共话将来数据库走向何方。





https://p3.toutiaoimg.com/large/pgc-image/SNINFms5qTXSbB
《新程序员》驻足于行业前沿,深度探索技术将来,通过音视频、图文专栏等丰富的多媒体情势为载体,全方位解读技术与产业,为中国开发者打开新时代的技术之门。

《新程序员001:开发者黄金十年》内容涵盖:

[*]60位+ 技术大咖的经典观点与实践干货;
[*]34篇
[*]13个 配文视频;
[*]1000位+ 技术人才共同砚习成长;
[*]2张 开源核心技术全景工具收藏图。

https://p9.toutiaoimg.com/large/pgc-image/SeKVkpjBdSPGf9

无论你是编程爱好者还是职场萌新,无论你是资深程序员还是架构师、CTO,在《新程序员》里,你都会有所劳绩。
页: [1]
查看完整版本: 十年比肩?看国产数据库如何突出重围!| 新步伐员