数据和云智能 发表于 2021-9-26 17:30:00

排行榜|当 DB-Engines 遇见墨天轮国产数据库排行

提到数据库排名,此时脑海里浮现出的是什么?是 DB-Engines,还是墨天轮数据库排行?两者间有什么区别?下面来聊一下业内这两个知名数据库排名平台。 本篇文章约有3000字,预计阅读时间7分钟,如阅读时间有限,请直接阅读文章末尾的对比表格。
正文开始前,作者先在这里贴标签,如有不准确、不全面的地方,接待文章下方留言交流。
DB-Engines 数据库排行

[*]国际数据库产物
[*]谷歌搜索引擎
[*]出现较早(2012 年)
[*]网络原因导致分数有偏差
墨天轮国产数据库排行

[*]聚焦国产数据库
[*]百度搜索引擎
[*]流行度盘算符合本土化
[*]平台官方月度解读
DB-Engines 数据库排行

主页:https://db-engines.com/en/(复制链接至欣赏器中欣赏)
DB-Engines 创建于 2012 年 10 月,由奥地利 IT 咨询公司 solid IT 创建和维护,截至本月(2021 年 9 月)即将运营满 9 年。
它的 Slogan 是“Knowledge Base of Relational and NoSQL Database Management Systems”,9 年间所收录产物从 2012 年最初纪录的 5 个分类、18 款数据库产物发展到如今的 15 个分类、378 款数据库产物,称得上是数据库的知识库,在相干产物对比及选型文章中不停被引用。
自多年前接触 DB-Engines开始,网站的主页始终保持这种怀旧的风格,不知道是否在传递着经典不褪色的意思?
https://p3.toutiaoimg.com/large/pgc-image/e1210032f6804dca92ccc4d969babe16(图源:DB-Engines 主页)
DB-Engines is a new initiative to collect and present information on relational and NoSQL database management systems.
DB-Engines 第一篇 Blog 的第一句话:“DB-Engines 是一个用来收集并显现关系型和非关系型数据库信息的新项目。”
在过去的一段时间,谷歌、亚马逊等厂商依托于强大的基础设施在数据领域的创新使行业发生天翻地覆的变化,发展的同时也给业内带来了一些困惑,DB-Engines 试图通过“人气值”即流行度得分的情势给出参考,同时提供了产物相对应的概念和属性。
DB-Engines 流行榜单概况

https://p26.toutiaoimg.com/large/pgc-image/b63eb773a75b47e7aa838f64c9b713b2
https://p9.toutiaoimg.com/large/pgc-image/a57707ab210e4414ba01786d72ead347(图源:DB-Engines 排名和曲线)
DB-Engines 9 月榜单,一眼望去 TOP 产物都是相对认识的主流数据库,个别产物虽没有利用过但也眼熟了。

[*]比较有意思的是甲骨文自家的开源产物 MySQL 总在觊觎 Oracle 的位子,没有赶超却数次迫近。
[*]曲线比较优美的要数 PostgreSQL 和 MongoDB,一路高歌猛进、得分稳定上涨。
在榜单解读方面 DB-engines 没有定期专栏解读,Blog 板块下的文章更新频率较低。
下面看下 DB-Engines 是通过什么方式盘算流行度的。
DB-Engines 怎样盘算流行度?

DB-Engines 网站对数据库流行度得分的盘算方式如下。

[*]数据库产物在网站上被提及的次数以搜索引擎查询中的结果数权衡。目前利用谷歌和必应进行这项测量,为了只盘算相干结果,DB-Engines 采集 以及对应的术语,例如“Oracle”和“database”。


[*]对这个体系的普遍兴趣对于这一权衡尺度,DB-Engines 利用的是Google Trends中的搜索频率。


[*]关于体系的技术讨论频率
利用知名 IT 相干问答网站 Stack Overflow 和 DBA Stack Exchange 上的相干题目数量和感兴趣的用户数量进行权衡。
[*]相干工作的 Offer 数量
利用的是领先的求职搜索引擎上的招聘信息,如 Indeed 和 Simply Hired。
[*]在专业网络中提到该体系的个人简介的数量
利用的是国际上最流行的职业交际网站 LinkedIn。
[*]交际网络中的相干性
统计推特上提到该体系的推文数量。
相识完流行度的盘算方式后不知你现在作何感想,6 个方面的内容难以覆盖到我们身边大部分人。这里不讨论“XX上网”,究竟有人离不开、有人嫌贫苦。个人觉得从本土化角度分析,离我们确实稍有点距离。

[*]都知道技术要利用 Google 找答案,但另有一部分同仁习惯于某度(设置主页的同学请举手);
[*]老玩家比较认识 Stack Overflow 和 DBA Stack Exchange 问答网站,现在利用频率怎样?
[*]LinkedIn 的简历是新的么?
[*]Indeed、Simply Hired 是否有利用过?还是和我一样只见过名字
可以说 DB-Engines 在一定程度上忽略掉了我们这个大市场。
固然友爱度欠佳,仔细看 DB-Engines 其实还是有我国部分数据库的身影,如 TiDB、PolarDB、SequoiaDB、TDSQL、KingBase、TSDB、TDengine、EsgynDB 和 K-DB 等产物,为你们点赞!
墨天轮国产数据库排行

主页:https://www.modb.pro/dbRank(复制链接至欣赏器欣赏)
回顾过去的两到三年,国产数据库迎来了一波新的发展,尤其在新基建驱动下如获新生,更多的用户和厂商也开始关注起国产数据库这一领域。
墨天轮国产数据库流行度排行在 2019 年和各人晤面,起初墨天轮排行榜中可以查到国际主流数据库的排名情况,从 2020 年 9 月开始,推出“国产数据库流行度排行”,聚焦国产产物,建设国产生态,同年 10 月榜单中加入了信通院评测参考指标,提供更丰富的参考维度。
https://p6.toutiaoimg.com/large/pgc-image/ba6625f4d057436d8763d5ee0f6f4e28(图源:墨天轮国产数据库排行)
墨天轮国产数据库流行度榜单由刚开始收录的 104 款产物发展至如今(2021 年 9 月) 142 款产物,涉及 8 个分类,显现国产数据库崛起、繁荣发展的一面。
以下是盖老师(eygle)对近年国产数据库发展的明白。
2019,国产数据库元年开启新纪元
2020,国产数据库崭露峥嵘的发轫之年
2021,国产数据库的躬行实践之年
墨天轮国产数据库流行榜单概况

https://p3.toutiaoimg.com/large/pgc-image/8dd25c34e17e4ea6867052c2c36bb839
https://p9.toutiaoimg.com/large/pgc-image/d75a43f71fb54ba1a83c75dbdc361780
(图源:墨天轮国产数据库排行和曲线)
以上截图是墨天轮 2021 年 9 月的国产数据库流行度榜单。

[*]Top10 中有 4 款是开源产物,并均位于 Top5,开源引领格局;
[*]本月 TiDB 虽分数有减但仍以绝对的分数优势稳居第一;
[*]OceanBase 得分下滑明显,达梦进一步拉近与 OceanBase 的距离;
[*]openGauss 凭借活跃的生态本月获得较大的涨幅,逾越 PolarDB 取得排名第四的佳绩。
详细解读请参考墨天轮发布的《2021年9月国产数据库排行榜:达梦奋起直追紧逼OceanBase,openGauss反超PolarDB再升一位》。
墨天轮怎样盘算流行度?

墨天轮重要根据如下数据来盘算出数据库当月的得分和热度。
0、加分项
Gartner市场份额排行;IDC市场份额排行;Gartner魔力象限;TPC-C排行;通过信通院评测;DB-Engines上榜。
后续计划引入专利数、论文数、公示的中标记录、参加知名论坛、权威评测榜单、举办运动次数等。
1、搜索引擎
引入百度、必应、谷歌以及微信公众号文章当月搜索条目数,且每个搜索引擎权重差别,如国内百度、公众号文章较高;
除了数据库英文名称搜索,加入中文化搜索如“金仓数据库”、“达梦数据库”等,且每个关键字设置了差别的权重,如中文化搜索较高;
清除关键字为通用英文的题目,如K-DB、CloudTable、TSDB等的搜索关键字改为海潮K-DB、华为CloudTable、阿里TSDB。
2、趋势指数
引入百度指数、360趋势数据。
3、博文数目
引入微信公众号、CSDN、墨天轮等社区中博文数目。
4、招聘岗位数
引入51JOB相干招聘数据。
5、文献数目
引入知网数据。
6、问答数目
引入CSDN、Stack Exchange、Stack Overflow、墨天轮问答数据,且权重差别,如CSDN、墨天轮问答较高。
相比 DB-Engines,墨天轮排行榜在本土化方面做的比较好,1 个加分项和 6 个稽核维度的内容看起来没有距离感。

[*]搜索引擎方面覆盖了常用的百度和必应,同时也包罗谷歌,更是有我们几乎每天都在读的公众号文章;
[*]趋势、博文数目、文献均符合本土化,尤其是知网、公众号和 CSDN 的引入;
[*]在招聘方面目前只看到有 51JOB 的数据,如果能加上其他常用招聘平台数据会更加完备。
除此之外,墨天轮结合每月结合产物流行度的动态,推出了“国产数据库排行榜 - 月度解读”专栏,官方发布解读文章,国产动态一清二楚。
https://p5.toutiaoimg.com/large/pgc-image/d10b2c0c66d24ffca408b982fe0b79df(图源:墨天轮国产数据库排行榜月度解读)
指数对比

前面两部分内容阐明白流行度的盘算方式,也看出在本土化渠道差别较大,为了进一步阐明,这里引入百度和谷歌的指数。
时间范围 2021.8.1~2021.8.31,分别观察在差别搜索引擎下搜索指数的差别。
Oracle/MySQL

https://p6.toutiaoimg.com/large/pgc-image/056cdd0158b84ddea4f72e271d82915b(图源:百度指数 Oracle/MySQL)
https://p26.toutiaoimg.com/large/pgc-image/306dfd4049944d27a98cbcd4803a3277(图源:谷歌趋势 Oracle/MySQL)
以下是 8 月的指数对比。

[*]百度指数

[*]MySQL 平均值 5045,Oracle 平均值 3564;
[*]MySQL 平均值约为 Oracle 的 1.42 倍。

[*]谷歌趋势

[*]MySQL 平均值 38,Oracle 平均值 75;
[*]MySQL 平均值约为 Oracle 的 0.51 倍。

在百度中明显 MySQL 热度更高,在谷歌中 8 月的平均值只达到 Oracle 的一半,两平台对与 Oracle 和 MySQL 的指数盘算是截然相反的。
TiDB/OceanBase/DAMENG

https://p5.toutiaoimg.com/large/pgc-image/1110fed5dce84956a6553e2a8c8e8ade(图源:百度指数 TiDB/OceanBase/DAMENG)
https://p6.toutiaoimg.com/large/pgc-image/3fb36a9ea5bb4c079042cb3797b5d25f(图源:谷歌趋势 TiDB/OceanBase/DAMENG)
以下是 8 月的指数对比。

[*]百度指数

[*]TiDB 平均值 656,OceanBase 平均值 395,达梦平均值 53;
[*]TiDB 指数平均值约为 OceanBase 的 1.66 倍,约为达梦的 12.38 倍。

[*]谷歌趋势

[*]TiDB 平均值 18,OceanBase 平均值 2,达梦平均值 2;
[*]TiDB 指数平均值为 OceanBase 的 9 倍,同样为达梦的 9 倍。

谷歌趋势中 OceanBase 和 达梦 的分数仅仅为 2,TOP 产物的分值比例也同百度存在较大的差别。
无论是主流产物的对比还是国内数据库产物的对比,两个平台的指数差别是相当大的,可见对产物流行度排行的影响。
这里贴出链接,可自行验证。
百度指数:https://index.baidu.com/(复制链接至欣赏器中欣赏)
谷歌趋势:https://trends.google.com/(复制链接至欣赏器中欣赏)
写在结尾

为了更直观显现 DB-Engines 和墨天轮国产数据库排行的区别和特点,结合文章开头提到的标签,直接上表格。
https://p6.toutiaoimg.com/large/pgc-image/626d4e5f64ad417ebe129d417d3cc4d1
看完以上内容,哪个榜单更适合你呢?
<hr>墨天轮原文链接:https://www.modb.pro/db/109350?sjhy(复制到欣赏器或者点击“阅读原文”立即检察)
关于作者
Tank,ACDU 成员,解决方案专家。7 年+数据库相干经验,善于制定决方案,所服务行业覆盖互联网、金融和运营商等。已获 Oracle OCM、MySQL OCP、RHCE 技术认证。热爱数据库技术,现专注于开源分布式数据库和中心件领域。
页: [1]
查看完整版本: 排行榜|当 DB-Engines 遇见墨天轮国产数据库排行