日前,艾瑞咨詢發布2022《中國數據庫研究報告》(簡稱《報告》),通過深入172家、覆蓋全國各區域、有代表性的數據庫用戶單位進行調研,揭示了數據庫行業新階段特征、國產廠商市占情況、不同行業市場空間差異、核心決策人的選型要點、發展走向等重要趨勢。
天云數據作為國內新興廠商入圍報告中國數據庫產業圖譜。
業務驅動HTAP技術成為重要底座,與分布式技術天然適配
報告稱,隨著業務系統接入數據源復雜性提升,混合負載需求愈發強烈,數據庫技術正向多源異構、高實時并發、多SQL標準接口的方向演進。過去,HTAP數據庫的技術架構以擴展主行存技術,在行存基礎上加列存的方式為主,典型代表有SQL Server,Oracle 和 L-store 等。隨著分布式技術不斷成熟,天然適配HTAP數據庫,于是開啟了分布式的架構實現,滿足了高并發需求,典型代表有SingleStore、MySQL Heatwave 和 Greenplum。
我們常規認為,數據庫分為關系型數據庫和非關系型數據庫,而HTAP數據庫只是其中的一個小品類,這種認知是錯誤的。MySQL路徑是國內數據庫的普遍實踐方式,然而經典MySQL體系的創始人兼CTO Michael Widenius認為,未來HTAP是一個主導性趨勢:“按數據容量劃分,一個大型企業在可單機部署的數據庫之上還需要Share Everything的HTAP架構?!碧煸茢祿诐J為:HTAP不是小品類,應該說在單機版之上,HTAP就是行業主導趨勢。
分布式現狀:技術特性趨于融合,云化部署大勢所趨,使用門檻不斷降低
根據報告,分布式數據庫是通過計算機網絡將物理分散的多個數據庫單元連接組成的邏輯上統一的數據庫。目前分布式數據庫的技術路線分為三類:分庫分表+中間件方案、共享存儲分布式數據庫、去中心化的分布式數據庫。當下分布式數據庫市場產品繁多,但其技術特性逐漸趨同,從兩個角度分析:其一,系統架構。存儲采用開源或者自研內核,用一主多從的數據副本保證數據完整性,計算通過SQL語句解析分發和結果匯聚,管控用于保證各模塊的高可用和故障切換等管理功能。其二,開源和自研兩條研發線路。開源主要基于MySQL 和PostGreSQL,難點在于源代碼改造的技術難度大;自研周期長且技術要求高,國內完全自研產品屈指可數。未來分布式數據庫的核心競爭要素為分布式事務的穩定性、產品全面性以及生態工具的完備性。
首先,工信部開展源代碼自主度測試方案,在400W+開源項目、10000W+組件數進行多維度自主度分析。核心功能包括源代碼開源率分析、軟件成分分析、開源安全漏洞風險分析、開源許可證合規性風險分析。天云數據公司自主研發的Hubble數據庫源代碼國產化率93%,系統自主研發率99.62%,是真正意義上自研數據庫。
其次,繼同一產品同一軟著同時通過信通院的事務和分析評測,天云數據Hubble數據庫再次通過中國信通院首批“可信數據庫”-HTAP數據庫產品評測,成為三家通過測評單位之一。
最后,Hubble數據庫100%基于GO語言編寫,可編排、可調度、運維量小,適合云原生時代,彈性伸縮,按需分配。我們知道,PC時代的產品語言是C/C++,C語言的理念是信任程序員,但應對大規模問題還是會捉襟見肘;互聯網時代換成了Java語言,雖然Java語言跨平臺異構的能力強,但因其編碼繁瑣,所以運行效率很低。C語言、Java語言都是業界的主流語言,為什么天云數據會選擇Go語言?在數據庫產品線,天云數據團隊早期沿著HBase技術路徑探索。后創立天云數據公司,面對銀行A類核心系統ACID 的事務需求,以及銀監會要求的兩地三中心容災要求,團隊開始面向交易體系進行分布式計算的原創路徑探索,Hubble數據庫重寫了HBase存儲引擎,采用Go語言研發,更適于服務化的云原生時代。相比與C語言、Java語言,Go語言在工程化能力以及性能上都是最適合天云數據的,可以實現邏輯層、調度層、計算層、存儲層的更小顆粒度的解析。天云數據就是站在Google這樣巨人的肩膀上,卸掉了C語言的包袱,快速地奔跑。