虎嘯龍吟之國產資料庫風雲榜-2022年01月

語言: CN / TW / HK

絕壁刻字

自古華山一條路,奇險天下第一山。

太陽初升,只見墨老大(墨天輪)一身白衣,瀟灑飄逸,蕭疏軒舉,湛然若神,忽見身體瞬間橫移,不見腿下腳下有任何動作,身體卻出現在幾十丈之外,使用的正是移形換位之法。

當前已立於華山百尺峽腳下,墨老大(墨天輪)雙足下泛起微弱光芒,正是以高深內力匯於腳下,忽聞一聲輕喝,確又如平地炸雷,墨老大起身向上飛起,在那懸崖絕壁處,運指為劍,白色幻影飄忽不定,忽左忽右,剎那間火光四濺,可見輕功和大力金剛指已達大成,轉眼已穩穩落地,清風吹過,只聽從山壁處傳來咔咔聲,碎石從山體脫落,現出矯若遊龍般幾個大字:“虎嘯龍吟天地動,國產DB排行來。”。

終於2022年虎年1月份國產資料庫武林大會拉開帷幕。

一戰封神

話說資料庫界的八大門派【武當派(關係型資料庫)、峨眉派(文件性資料庫)、崆峒派(鍵值資料庫)、崑崙派(寬列儲存資料庫)、點蒼派(圖形資料庫、華山派(分散式資料庫)、青城派(雲原生)、嵩山少林派(時序資料庫)】,每月都會參加武林大會。

墨老大(墨天輪)隨手拿起百斤鐵弓,弓拉滿月,鐵箭尾端掛一卷軸,剎那間,鐵箭如流星般射入絕壁山巔,箭身完全沒入山體,箭尾卷軸自然垂下,原來是2022年1月份的武林大會(國產資料庫)排行榜。

眾人紛紛擡頭檢視排行榜,榜單前17名居然和上個月保持不變,其中前五名如下:

第一名:華山派的令狐沖(TiDB資料庫)

第二名:武當派的沖虛道長(openGauss資料庫)

第三名:武當派張三丰(達夢資料庫)

第四名:華山派劍宗封不平(OceanBase資料庫)

第五名:青城派餘滄海(GaussDB資料庫)

華山派(分散式資料庫)的令狐沖(TiDB資料庫),更是連續兩年排名第一,但是評分較比上個月下降7.67分,而第二名到第五名,評分較上個月都有大幅度提升。

雖然第二名較第一名還差70多分,但是上升趨勢驚人,第二名武當派的沖虛道長(openGauss資料庫)較比上個月上漲了49.55分,與第一名華山派(分散式資料庫)令狐沖(TiDB資料庫)分數逐漸在拉近。

華山論劍

八大門派【武當派(關係型資料庫)、峨眉派(文件性資料庫)、崆峒派(鍵值資料庫)、崑崙派(寬列儲存資料庫)、點蒼派(圖形資料庫、華山派(分散式資料庫)、青城派(雲原生)、嵩山少林派(時序資料庫)】每派武功招式各不相同,現將每派高手進行分別排名。

武當派(關係型)

武當派(國產關係型資料庫)有118人,人數最多。

武力值前2名分別是沖虛道長(openGauss)、張三丰(達夢)。

沖虛道長(openGauss資料庫)武當劍法更勝從前,2021年12月28日,以“匯聚資料庫創新力量 逐夢數字時代星辰大海”為主題的openGauss summit 2021在北京線上線下同步舉辦。大會現場,openGauss開源社群理事會和技術委員會升級,openGauss社群分委會正式成立,中國電信釋出行業首個雲原生關係型資料庫TeleDB for openGauss,中國聯通啟動基於openGauss的資料庫自主創新(CUDB)。

關係型資料庫,是指採用了關係模型來組織資料的資料庫,其以行和列的形式儲存資料,

以便於使用者理解,關係型資料庫這一系列的行和列被稱為表,一組表組成了資料庫。

關係模型可以簡單理解為二維表格模型,而一個關係型資料庫就是由二維表及其之間的關係組成的一個數據組織。

關係型資料庫管理系統 RDBMS在E.F.Codd博士發表的論文《大規模共享資料銀行的關係型模型》(Communications of the ACM雜誌1970年6月刊)基礎上設計出來的。

它通過資料、關係和對資料的約束三者組成的資料模型來存放和管理資料。

峨眉派(文件型資料庫)

記得當年郭襄心中仍掛念楊過,直到40歲那年才突然大悟,並削髮為尼開創峨眉一派,後將掌門的位置傳給了滅絕師太,又輾轉多個年代,人員凋零,只有國外的MongoDB、CouchDB等,國內目前無一人繼承峨眉派功夫(文件型資料庫)。

文件型資料庫是NoSQL中非常重要的一個分支,它主要用來儲存、索引並管理面向文件的資料或者類似的半結構化資料。

顧名思義,文件型資料庫(面向文件資料庫)的關鍵核心概念即文件(Document),它是資料庫中最小的單位。

每一種文件型資料庫的部署都有所不同,通常來說,它們假定文件以某種標準化格式封裝並加密資料,並用多種格式進行解碼,包括XML、YAML、JSON和BSON,當然也包括二進位制格式如PDF、微軟Office文件等。

MongoDB是一種面向集合,模式無關的文件型資料庫。

其中資料以“集合”的方式進行分組,每個集合都有單獨的名稱並可以包含無限數量的文件。這裡的集合同關係型資料庫中的表(table)類似,唯一的區別就是它並沒有任何明確的schema。CouchDB文件型資料庫,可以通過JSON格式的REST介面進行訪問,使用JavaScript作為查詢語言。一個CouchDB文件就是一個物件,由不同欄位組成。欄位值可以是字串、數字、日期,甚至可以是有序列表和關聯對映。

崆峒派(鍵值型)

崆峒派下設飛龍門、追魂門、奪命門、醉門、神拳門五大門。

目前國內只有三家,排名分別是飛龍門關能(TcaplusDB)、醉門宗維俠(Tendis)、神拳門唐文亮(Haisql_memcache)。

飛龍門關能(TcaplusDB)一隻判官筆靈巧陰柔,令人不敢輕視,TcaplusDB是騰訊出品的分散式NoSQL資料庫,儲存和排程的程式碼完全自研。具備快取+落地融合架構、PB級儲存、毫秒級時延、無損水平擴充套件和複雜資料結構等特性。同時具備豐富的生態、便捷的遷移、極低的運維成本和五個九高可用等特點。客戶覆蓋遊戲、網際網路、政務、金融、製造和物聯網等領域。

醉門宗維俠(Tendis)醉拳功夫也是爐火純青,型醉意不醉,雲資料庫 Tendis 是騰訊雲自研、100%相容 Redis 協議的資料庫產品,作為一個高可用、高效能的分散式 KV 儲存資料庫,從訪問時延、持久化需求、整體成本等不同維度的考量,完美的平衡了效能和成本之間的衝突,降低業務運營成本,提升研發效率。雲資料庫 Tendis 支援主從熱備,提供自動容災切換、資料備份、故障遷移、例項監控、線上擴容、資料回檔等全套的資料庫服務。2020年12月,騰訊宣佈開源 Tendis 。

鍵值資料庫是一種非關係資料庫,它使用簡單的鍵值方法來儲存資料。

鍵值資料庫將資料儲存為鍵值對集合,其中鍵作為唯一識別符號。

鍵和值都可以是從簡單物件到複雜複合物件的任何內容。

崑崙派(寬列儲存)

目前有兩家寬列儲存資料庫,排名分別是乾坤一劍震山子(GeminiDB)、崑崙三聖何太沖(iBASE)。

雲資料庫GeminiDB是一款基於華為自主研發的計算儲存分離架構的分散式多模NoSQL資料庫服務。在華為雲高效能、高可用、高安全、可彈性伸縮的基礎上,提供了一鍵部署、備份、監控等服務能力。相容 Cassandra 等主流 NoSQL 介面,具有高性價比,適用於IoT、氣象、網際網路、遊戲等領域。

寬列儲存資料庫 (Wide-Column Database),也稱作可擴充套件記錄儲存 (Extensible record Stores) 是一種兼具了廣泛的可使用性、可拓展性、高效能和高可用性的分散式 NoSQL 資料庫。

最早由 Google 在其發表的《Bigtable: A Distributed Storage System for Structured Data》論文中提出,HBase, Cassandra 均為被廣泛使用的寬列式儲存。

寬列儲存資料庫也長被稱為 寬列儲存。在記錄中儲存資料,能夠容納非常多的動態列。

由於列名和記錄鍵都不是固定的,而且一個記錄可以有數十億列,所以寬列儲存可以被看作是二維鍵值儲存。

點蒼派(圖形)

目前有23家,前2名分別是:點蒼一筆林傖夫(TGDB)、君子悠然君無幽(Alibaba GDB)。

騰訊雲數圖TGDB是騰訊雲推出的一款原生的分散式並行圖資料庫,這款資料庫能夠實現萬億級關聯關係資料實時查詢,高效治理異構資料,支援實時圖計算,助力企業打通資料孤島。

對比傳統的關係型資料庫,TGDB以原生方式實現屬性圖,高效儲存關聯資料,支援千億級節點大圖的高效查詢和關聯分析,通過支援PageRank、社群發現、相似度計算、模糊子圖匹配等社群發現演算法實現高效能圖計算,在處理關聯關係上效能提升了千倍以上。

圖資料庫是以點、邊為基礎儲存單元,以高效儲存、查詢圖資料為設計原理的資料管理系統。

圖概念對於圖資料庫的理解至關重要。圖是一組點和邊的集合,“點”表示實體,“邊”表示實體間的關係。

在圖資料庫中,資料間的關係和資料本身同樣重要,它們被作為資料的一部分儲存起來。

這樣的架構使圖資料庫能夠快速響應複雜關聯查詢,因為實體間的關係已經提前儲存到了資料庫中。

圖資料庫可以直觀地視覺化關係,是儲存、查詢、分析高度互聯資料的最優辦法。

與關係型資料庫的對比

在關係型資料庫設計的時候需要進行嚴格的資料規範化,將資料分成不同的表並刪除其中的重複資料,這種規範化保證了資料的強一致性並支援ACID事務。

然而,這也對關係查詢帶來的限制。

快速的實現逐行訪問是關係型資料庫的設計原理之一,當資料的資料之間形成複雜的關聯時,跨表的關聯查詢增加,就會出現問題。

雖然可以通過將存在不同表中的不同屬性進行關聯從而實行復雜查詢,但是開銷是非常大的。

與關係型資料庫相比,圖資料庫把關係也對映到資料結構中,對於關聯度高的資料集查詢更快,尤其適合那些面向物件的應用程式。

同時圖資料庫可以更自然的擴充套件到大資料應用場景,因為圖資料庫Schema更加靈活,所以更加適合管理臨時或不斷變化的資料。

華山派(分散式)

目前有23家,前2名分別是:令狐沖(TiDB)和封不平(OceanBase)。

近日,賽迪顧問正式釋出《2021 中國分散式資料庫最具成長價值企業研究報告》,報告從技術創新力和市場影響力兩個維度對中國分散式資料庫創新企業進行評估,平凱星辰在技術創新力的維度排名第一。

分散式資料庫系統 (DDBS)包含分散式資料庫管理系統(DDBMS)和分散式資料庫(DDB)。

在分散式資料庫系統中,一個應用程式可以對資料庫進行透明操作,資料庫中的資料分別在不同的區域性資料庫中儲存、由不同的 DBMS進行管理、在不同的機器上執行、由不同的作業系統支援、被不同的通訊網路連線在一起。

一個分散式資料庫在邏輯上是一個統一的整體,在物理上則是分別儲存在不同的物理節點上。一個應用程式通過網路的連線可以訪問分佈在不同地理位置的資料庫。它的分佈性表現在資料庫中的資料不是儲存在同一場地。更確切地講,不儲存在同一計算機的儲存裝置上。

這就是與集中式資料庫的區別。從使用者的角度看,一個分散式資料庫系統在邏輯上和集中式資料庫系統一樣,使用者可以在任何一個場地執行全域性應用。分散式資料庫系統是在集中式資料庫系統的基礎上發展起來的,是計算機技術和網路技術結合的產物。

青城派(雲原生)

當前有5家,前2名分別是:餘滄海(GaussDB)、極樂真人李靜虛(TDSQL)。

TDSQL是騰訊雲企業級分散式資料庫,旗下涵蓋金融級分散式、雲原生、分析型等多引擎融合的完整資料庫產品體系,提供業界領先的金融級高可用、計算儲存分離、資料倉庫、企業級安全等能力,同時具備智慧運維平臺、Serverless版本等完善的產品服務體系 。

雲原生資料庫,是一種通過雲平臺進行構建、部署和分發的服務。

這種雲原生屬性是它相比於其他型別資料庫最大的特點。

作為一種雲平臺,雲原生資料庫以PaaS(平臺即服務,Platform-as-a-Service)的形式進行分發,也經常被稱作DBaaS(資料庫即服務,DataBase-as-a-Service)。

使用者可以將該平臺用於多種目的,例如儲存,管理和提取資料。

雲原生資料庫通常通過在雲基礎設施之上安裝資料庫軟體來實現,這種方式使得雲原生資料庫具備了傳統資料庫所不具備的直接訪問性和執行時可伸縮性。

隨著雲原生資料和海量計算的重要性不斷提高,人們空前重視通過部署這種服務為企業提供增強的可靠性和可伸縮性。

雲原生是一種新型技術體系,是雲端計算未來的發展方向。

雲原生資料庫在海外被稱為「Cloud-Native Database Systems」,前面譯成中文就是「雲原生」,理解雲原生先要理解兩個關鍵詞——雲和原生。

在傳統資料庫的系統架構下,必須是緊耦合的設計方式,才能最大效能地發揮系統的優勢。

雲就是使用虛擬化的技術將資源池化。

這就是雲原生核心邏輯,將不同型別資源解耦,並進行池化。

比如在雲原生的計算儲存分離架構下,業務節點可以根據需要自由地對計算、儲存進行快速的擴縮容等操作。

嵩山少林派(時序)

當前有23家,前2名分別是:少林方丈方證大師(TDengine) 、方生大師(DolphinDB)。方丈方證大師(TDengine)易筋經力壓群雄,是真正的武林泰斗,TDengine是濤思資料專為物聯網、車聯網、工業網際網路、IT運維等設計和優化的大資料平臺。除核心的快10倍以上的時序資料庫功能外,還提供快取、資料訂閱、流式計算等功能,最大程度減少研發和運維的複雜度,且核心程式碼,包括叢集功能全部開源。

時序資料庫全稱為時間序列資料庫。

時間序列資料庫指主要用於處理帶時間標籤(按照時間的順序變化,即時間序列化)的資料,帶時間標籤的資料也稱為時間序列資料。時間序列資料主要由電力行業、化工行業、氣象行業、地理資訊等各型別實時監測、檢查與分析裝置所採集、產生的資料,

這些工業資料的典型特點是:

產生頻率快(每一個監測點一秒鐘內可產生多條資料)、嚴重依賴於採集時間(每一條資料均要求對應唯一的時間)、測點多資訊量大(常規的實時監測系統均有成千上萬的監測點,監測點每秒鐘都產生資料,每天產生幾十GB的資料量)。

基於時間序列資料的特點,關係型資料庫無法滿足對時間序列資料的有效儲存與處理,因此迫切需要一種專門針對時間序列資料來做優化的資料庫系統,即時間序列資料庫。對於時序大資料的儲存和處理往往採用關係型資料庫的方式進行處理,但由於關係型資料庫天生的劣勢導致其無法進行高效的儲存和資料的查詢。時序大資料解決方案通過使用特殊的儲存方式,使得時序大資料可以高效儲存和快速處理海量時序大資料,是解決海量資料處理的一項重要技術。該技術採用特殊資料儲存方式,極大提高了時間相關資料的處理能力,相對於關係型資料庫它的儲存空間減半,查詢速度極大的提高。時間序列函式優越的查詢效能遠超過關係型資料庫。

恭賀新春

華山論劍已接近尾聲,眾派掌門按照八卦陣方位站立與華山山頂,分別站在震卦、巽卦、離卦、坤卦、兌卦、乾卦、坎卦、艮卦位置,氣沉丹田,雙掌朝上,同時向天空連揮數掌,八股有型的空氣波出現在頭頂數丈高空,幾個大字在天空緩緩出現:

瑞雪翩翩豐收景,虎蹄朵朵報春花。

提前祝大家,新年快樂!

備註:文中引入了各種比喻,門派、武俠人物等請勿對號入座。


原文連結:https://www.modb.pro/db/240271

宣告:本文為墨天輪作者 陳舉超 原創內容,代表作者觀點。如您對上述內容有意見和建議,請在下方評論區指點和交流,或點選作者墨天輪主頁留言。*

相關閱讀


墨天輪,圍繞資料人的學習成長提供一站式的全面服務,打造集新聞資訊、線上問答、活動直播、線上課程、文件閱覽、資源下載、知識分享及線上運維為一體的統一平臺,持續促進資料領域的知識傳播和技術創新。

關注官方公眾號: 墨天輪、 墨天輪平臺、墨天輪成長營、資料庫國產化 、資料庫資訊

「其他文章」