圖資料庫賽道興起,看 NebulaGraph 如何打造差異化!
5G、物聯網、AI 等新興技術的不斷髮展,不僅讓資料量急劇攀升,同時也使得資料的關聯變得複雜化,而傳統的關係型資料庫往往無法承接這些變化。相比之下,圖資料庫在處理關聯關係上的效能則更具有優勢,也能夠深挖資料之間的關聯性,釋放資料的潛在價值。
為了深入瞭解圖資料庫的發展趨勢與落地情況,InfoQ 記者有幸在 2022 ArchSummit全球架構師峰會北京站 上,採訪了 NebulaGraph CTO 於新林老師。
以下是影片採訪的全部內容,為方便讀者檢視,影片下方也附上了文字內容。
00:00 / 00:00
1.0x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.5x
網頁全屏
全屏
00:00
InfoQ:近年來,我們看到越來越多的公司開始進軍圖資料庫領域,對於廠商自身而言,如何才能打出差異化?
於新林:在考慮差異化之前,我們首先要考慮客戶需要什麼,我們解決了客戶哪方面的問題,然後再考慮如何做好,給客戶提供更大的價值。當我們在服務好客戶的時候,差異化如何體現呢?
目前來看,我們的圖資料庫產品 NebulaGraph 的幾個關鍵詞是:開源、分散式、OLTP+OLAP、計算儲存分離、處理超大規模資料、高效能。對於杭州悅數科技有限公司來說,做好產品,服務好客戶就是我們打出的差異化:NebulaGraph 穩定性好,原生分散式,並且可以支援大規模海量資料。
另外,作為一家堅持開源的圖資料庫廠商,我們一直保持服務好使用者的初心,給客戶提供更優質的服務。在前期的 POC 階段,我們可以跟客戶一起理清他們的資料模型,幫助客戶寫一些資料上的語句,讓他們更好地使用圖資料庫。上線以後,我們會快速地響應客戶的問題以及持續地給客戶提供升級、運維的一整套服務。
InfoQ:對於企業而言,又該如何結合自身業務選擇最適合自己的圖資料庫產品?或者說,選擇一款圖資料庫需要從哪幾個維度去考慮?
於新林:我感覺企業要想選圖資料庫主要從以下幾個方面出發:
首先,要看業務的場景,如果你的業務是偏線上實時交易的,那就需要選擇 OLTP 能力比較強的圖資料庫,如果你的場景是偏圖計算和分析的,可能要選一款偏 OLAP 的,亦或者兩種場景都需要,那就選擇混合的;
其次,要考慮圖資料庫的穩定性,如果不穩,其實業務都無法開展。另外就是效能因素,這款圖資料庫產品的併發情況、響應時間等等;此外,由於圖資料庫中有大量資料是從外部匯入的,因此,也需要考慮海量資料的匯入效能和時間是否滿足業務需求。最後,當我們選擇圖資料庫廠商時,也需要考慮服務持久化的問題。
InfoQ:據 Gartner 預言,圖資料庫很快約佔到資料庫領域 10%市場。從您的觀察來看,圖技術的落地情況達到了怎樣的階段?
於新林:圖技術是一個快速發展的方向,是否佔 10%我沒法準確感受。我能感受到的是:起風了。從目前市場來看,客戶對圖相關接受度越來越高,購買、使用圖資料庫的客戶越來越多,這基於兩個方面:一方面得益於技術的成熟,另一方面是客戶的認知和對圖的需求逐漸攀升。圖技術相關領域其實蠻廣泛的,圖計算、分析、儲存、渲染、展示、圖+AI 以及各種各樣基於圖的業務應用,如社交、防疫、供應鏈、知識圖譜等。我們最近也釋出了幾個聯合方案:金融反欺詐、智慧投研平臺、智慧運維,通過這些方案,讓我們能更好地配合合作伙伴的業務,推動生態的健康發展。
InfoQ:與傳統關係型資料庫相比,圖資料庫雖然可以從海量資料中挖掘資料的關聯,但據瞭解,目前市面上的圖資料庫產品還很難滿足快速實時匯入資料。能否請您介紹下,目前圖資料還存在哪些侷限性?
於新林:從我們目前接觸客戶來看,客戶對快速實時匯入確實是剛需,我們這方面能力相對還好,目前感覺不是瓶頸。我現在一個基本的感受是:圖技術,相對於關係型資料庫來說屬於新興技術,可能對於很多國內使用者來說對還比較陌生,但其實這項技術在海外已經盛行了幾十年,包括 NASA、ebay、airbnb 在內的大小企業都在使用圖資料庫來解決通訊、 網際網路、電子商務、社交網路和物聯網等場景下的資料問題。近幾年,圖資料技術在國內也逐漸開始火熱,NebulaGraph 也逐漸被騰訊、美團、京東、360 數科、微眾銀行、小紅書、知乎、快手、BOSS 直聘等許多知名企業採用。
雖然現在國內圖資料庫行業還不夠成熟,標準也不完全統一,但同時我們也欣喜地看到國內網際網路大廠、以及像 NebulaGraph 這樣的專業廠商,正在努力構建一個成熟完善、使用者友好的生態。相信假以時日,我們能夠讓更多使用者低門檻地使用各種圖探索工具,感受圖演算法的快捷高效、更生動地感受到“圖”資料的直觀性和處理關聯資料的強大能力。
InfoQ:面對行業的痛點問題,NebulaGraph 做了哪些迭代和優化?
於新林:客戶目前的一些痛點問題主要還是在穩定性、效能、大資料、高可用、實效性以及資料匯入效能等。針對這些痛點,我們通過產品的一個個迭代和版本逐步解決。
舉例來講,為了解決穩定性問題,我們加大了測試的投入,包括功能測試、長期穩定測試、極限壓力測試、混沌測試等等;為了解決高可用問題,我們做了很多功能,包括快速擴縮容、資料 balance、備份恢復、叢集間複製等等。通過一次次迭代和優化,能在最短時間內解決客戶的痛點問題,也儘快建立起和客戶之間的信任關係,客戶會更放心的使用我們的產品。
InfoQ:在 NebulaGraph 資料庫支援下,已經解決了哪些企業的問題,能否分享幾個成功的案例?
於新林:在 官網 上有很多這樣的案例,這些都是客戶貢獻的案例說明,比較客觀一些。我分享兩個:我們有家客戶是偏政府的,他們最大的特點就是資料量特別大,而且資料量在持續地增長,點在千億級別、邊在萬億級別,他們的資料需要定期匯入。最大的訴求是分散式、支援海量資料、快速響應時間以及很高的匯入速度。剛好我們的產品能比較好地滿足他們的需求,所以兩邊能很快地配合進行 POC、驗證、上線,現在已經持續穩定跑了很久。
另一個是微眾銀行在資料血緣方案中,引入了 NebulaGraph 作為大資料平臺的圖資料基礎。主要看中了快速匯入大規模資料、低時延的實時計算,可以很好地幫助微眾銀行生成一份資料地圖,以快速發現數據問題、定位和分析以及解決問題,幫助業務開展。
InfoQ:在 2021 年 AS 的專訪中,您提到了 NebulaGraph 接下來的三個計劃,分別是 NebulaGraph 上雲,加大對 AP 領域的投入,以及把圖的計算和圖的分析以 SaaS 化的服務形式搬上雲。想了解下,目前的進展如何,是否有達到團隊的預期?
於新林:目前相關工作在持續開展,NebulaGraph 上雲這部分是開展比較快的一部分。目前我們已經和多家雲廠商在緊密的合作,包括 Azure、阿里雲、AWS、Gcp、華為雲等等。目前產品已經在部分雲廠商上線了,國內在阿里雲已經上線,大家可以免費試用。
AP 領域也在有序推進,相對進展沒有這麼快,當前主要把 AP 和 TP 產品做了整合,主要解決了客戶易用性問題,讓客戶更加方便地使用圖資料庫和圖計算的能力。SaaS 是我們未來要做的事,但目前還不是重點,現階段我們還是會更關注底層資料庫的效能和最佳使用者體驗。還是要集中優勢兵力把當前這個產品打磨好,本身這些產品也是為將來 SaaS 服務的一個根基,可能會到明年左右開始發力 SaaS 服務。當然了,考慮到終端使用者的實際使用需求,NebulaGraph 也正在與一些 ISV 和 SI 企業積極合作,這些生態夥伴中不乏有多年垂直領域行業經驗的解決方案提供商,通過提供圖資料庫底座能力給到他們來實現面向使用者的方案,便於終端使用者部署落地。
InfoQ:謝謝於老師接受採訪,也期待 NebulaGraph 在接下來有更大的突破。
- 那些 Go 語言發展歷史上的重大決策
- 從趨勢到挑戰,一站式解讀作業系統運維和可觀測性
- 百萬級 Topic,騰訊雲的 Apache Pulsar 穩定性實踐
- Apache Doris 在思必馳的應用優化實踐:海量語音通話資料下,實時、離線一體的數倉架構設計實踐
- 愛數正式開源認知智慧開發框架 KWeaver
- 運維智慧化的三大關鍵技術
- “抄我的還‘反捅’我一刀”,Gary Marcus 發文駁斥圖靈獎得主 Yann LeCun
- 當出海成為必選項,企業如何構建全場景全生態技術底座?
- 數智底座必備能力三:快速構建創新應用
- Docker 多階段構建實戰 (multi-stage builds)
- 工作筆記之 SELECT 語句在 SAP ABAP 中的用法總結(上)
- 經久不衰的設計定律是不要讓我思考的設計
- 不要指望下一個像 GPT 這樣的大型語言模型會民主化
- Java 近期新聞:Helidon Níma、Spring Framework、MicroProfile、MicroStream、Kotlin 和 Piranha
- 一文入門 jQuery
- C 學習 ---__libc_open 函式的原理
- 監控系統工作原理
- 甲骨文新微服務框架 Helidon Níma:使用虛擬執行緒實現高效能
- 【雲原生 | 從零開始學 Kubernetes】二、使用 kubeadm 搭建 K8S 叢集
- Elasticsearch 聚合學習之四:結果排序