国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

國產數據庫出海,技術大航海時代的冒險與底氣

甲子光年
+ 關注
2022-08-16 10:12
500次閱讀
國產數據庫出海,技術大航海時代的冒險與底氣

中國企業準備好了嗎?

作者 | 趙健

一提到國產數據庫,我們通常會聯想到自主研發、國產升級。

的確,數據庫曾是35項“卡脖子”清單的項目之一。直到2016年,在第七屆中國數據庫技術大會上,甲骨文副總裁吳承楊演講時提到一組數據,Oracle、IBM、微軟三家合計占據中國80%的市場份額,并強調“去IOE”對甲骨文并無影響,但教會了甲骨文如何貼近用戶。
但今天要講的不是國產升級的故事。實際上,今天的國產數據庫已經在國內市場占有一席之地。IDC發布的《2021年下半年中國關系型數據庫軟件市場跟蹤報告》顯示,前八強中除了亞馬遜、甲骨文和微軟外,其余5家都是中國廠商,合計占據超過74%的市場份額。
國產數據庫出海,技術大航海時代的冒險與底氣
如果我們回看最近幾年的國產數據庫,會發現一個新的增量邏輯——出海。
毫無疑問這是一個不確定性更大、難度更高的冒險,但故事的主角們正在躍躍欲試:
  • 很多數據庫創業公司,成立之初就定位國際化,比如分布式開源數據庫PingCap、開源向量數據庫系統Zilliz、云原生流式數據庫Singularity等,已經著手在北美市場展開業務;
  • 互聯網公司的自研數據庫,把產品賣向了東南亞:2020年,騰訊云數據庫TDSQL在印尼Bank Neo Commerce銀行新核心系統完成搭建并正式投入使用;螞蟻集團的Oceanbase先后服務過印度、印尼、菲律賓、巴基斯坦等國家的金融科技公司。
8月10日,OceanBase CEO楊冰在4.0產品發布會上也首次公開提到了出海戰略,作為OceanBase的第三極增長引擎。
中國企業出海并非新鮮事,無論是游戲、互聯網、跨境電商,都可以找到非常優秀的國產品牌。但這些企業基本都是業務應用出海,而數據庫卻是一個技術壁壘非常高的基礎軟件。
從國產升級到出海,數據庫能否開啟一個屬于中國基礎軟件的大航海時代?

1.數據庫的新增量——出海

國產數據庫出海,技術大航海時代的冒險與底氣
近日,全球權威IT咨詢機構 Forrester 發布了2022年度Translytical方向的數據平臺廠商選型報告,國內自主研發的原生分布式數據庫OceanBase成功入選。 該報告針對數據庫技術給業務和客戶所帶來的影響提供務實和具有前瞻性的建議,是業界公認的極具價值的權威報告。
除OceanBase以外,阿里、騰訊、PingCAP都位列其中,這也是中國廠商首次入選該報告。
這是一個國產數據庫從長期以來的追趕者角色,在國際市場舞臺嶄露頭角的信號。
中國的數據庫公司集中成立在兩個周期,第一個周期在1999年前后,這一年國內第一家數據庫公司人大金倉成立,與后來的南大通用、武漢達夢、神舟通用,并稱為國產數據庫的四朵金花。
第二個周期在2012年之后,這一年大數據成為國家級發展戰略,互聯網的蓬勃發展也讓數據庫有了更多鍛煉的土壤,市場上開始涌現出一大批數據庫創業公司。最近兩年,在市場資本的追捧下,數據庫成為基礎軟件領域的“風口”,僅2021年新成立的數據庫公司就有30多家。
國產數據庫出海,技術大航海時代的冒險與底氣
此外, 國內的大型互聯網公司出于成本的考慮,也開始自研數據庫。 2007年,騰訊云決定自研數據庫TDSQL; 2010年6月,OceanBase寫下了第一行代碼; 阿里云2017年啟動自研云原生數據庫PolarDB。
以四朵金花為代表的國產數據庫,過去通常聚焦于軍工、政務等封閉領域,整體市場份額較小,但如今電信、金融等重要行業數據庫改造變更需求不斷,存量市場前景誘人。根據中國信通院預測,到2025年,中國數據庫市場總規模將達到688億元,市場年復合增長率 (CAGR) 為23.4%。
雖然增速很快,但放眼全球,國產數據庫整體的市場規模占比卻很小。
根據中國信通院最新數據,2021年全球數據庫廠商有363家,其中中國有116家,占比32%;而在全球700億美元的市場規模中,中國市場只有47億美元,僅占5.2%。
用5.2%的市場養活32%的數據庫企業,著實是一片紅海。
數據庫是一個典型的投入高、周期長、難度大的基礎軟件。中國的數據庫產品多數基于MySQL、PostgreSQL等開源數據庫二次開發而來,如果從零開始自研一款數據庫產品,在成立的前幾年可能都是零收入的狀態。
數據庫天然帶有全球化基因,其底層語言都是一行一行代碼,而全世界的數據庫程序員都能看得懂SQL語句。一款偉大的數據庫產品,也必然是一款全球化產品。
全球化是一個廣闊的藍海市場。OceanBase解決方案部副總經理弓子介告訴「甲子光年」:“即使是在一些發展中國家,比如哈薩克斯坦,其最大的電商企業Kaspi.kz,將OceanBase用于一個非常簡單的業務場景,同樣規格下的價格可能是國內的5~10倍。”
理想很豐滿,但出海首當其沖需要在技術與產品力上“修煉內功”。過去十年,對于國產數據庫而言,這一內功就是“分布式”。

2.分布式架構:一次換道超車的機會

國產數據庫出海,技術大航海時代的冒險與底氣
數據庫的發展有很多趨勢,招商證券曾梳理過七大維度——
  • 技術架構:單機,集中式;分布式;
  • 數據模型:層狀、網狀,關系型,NoSQL,NewSQL;
  • 部署方式:本地部署,云部署;
  • 需求功能:聯機事務處理OLTP,聯機分析處理OLAP,一體化混合負載HTAP;
  • 存儲介質:磁盤數據庫DRDB,內存數據庫MMDB;
  • 商業模式:商業,開源;
  • 治理模式:自適應,自調優,自治。
國產數據庫出海,技術大航海時代的冒險與底氣
圖片來源于招商證券
其中,從“集中式架構”到“分布式架構”的演進,對于國產數據庫追趕世界級數據庫,等同于一次“換道超車”的機會。
什么是分布式技術?OceanBase首席科學家陽振坤曾對此做過一個比喻:
把數據庫看做一架飛機,數據就是乘客。當乘客越來越多,傳統單機、集中式數據庫,只能靠增加飛機來解決,但飛機與飛機之間不能連同,造成資源的浪費,以及運營、運維的不方便;分布式數據庫,始終就是一架飛機,當乘客少的時候,是一架小飛機;當乘客多的時候,就自動變成一架大飛機,而且是一架無限大的飛機。
谷歌在2003至2004年公布了三篇技術論文——分布式文件系統GFS,分布式KV存儲數據庫“Big Table”,處理和生成超大數據集的算法模型“MapReduce”,被稱為分布式系統的“三駕馬車”,這些論文的思想誕生了Hadoop生態,也為分布式數據庫做好了基墊。2012年Google又發表了2篇論文——spanner和F1,此后業內產生了大量的分布式數據庫。
早期的分布式數據庫多為“分庫分表中間件”,是一種分布式的過渡形態,以社交、電商等互聯網公司自研為主。分庫分表可以解決擴展性的需求,但對復雜查詢業務的支持性較差,而且隨著業務增長對于數據庫運維人員的依賴越來越高。
2010年,螞蟻集團決定自研數據庫,OceanBase誕生,寫下了第一行代碼。此后,巨杉數據庫、星環科技、PingCap等一批數據庫廠商成立,他們采用了新的技術架構——原生分布式。
在一開始在定技術架構路線的時候,OceanBase曾考慮過基于現有開源產品或單數據庫做架構,但很快就被否掉了。OceanBase CTO楊傳輝表示:“因為那種產品就不是這個時代的產物,很難從根本上、從頂層設計的角度來支撐未來場景。我們覺得應該從零到一把分布式與數據庫相結合,因此從1.0時期就堅定地走分布式路線。”
原生分布式數據庫可以解決兩大問題,首先是高可靠性。
政府、銀行、保險、證券等企業客戶對于數據庫的核心訴求在于,在不改代碼的前提下,將過去在Oracle或IBM數據庫上的“古董”級別的應用平滑遷移到國產數據庫上。
弓子介告訴「甲子光年」:“這需要國產數據庫內核做大量的兼容性功能,是一個非常耗費人力跟精力的事情,一些‘古老’的程序語言,我們甚至從來都沒有用過。OceanBase花費了大概四年的時間,才在兼容IOE架構層面做出了一個不錯的成績。”
此外,OceanBase還推出了“三地五中心”城市級容災標準。如果其中某個服務器發生故障,業務從中斷到恢復的時間 (RTO,Recovery Time Objective,恢復時間) 僅為8秒。
數據庫的運行就像F1賽車比賽,RTO就是中間的換胎環節,必須爭分奪秒。F1換胎是提前規劃與演練,而數據庫的故障卻是隨時可能發生,并且不需要人工干預。
強大的分布式技術讓OceanBase已經連續9年穩定支撐雙十一,其首席科學家陽振坤曾開玩笑似的立下軍令狀:“如果OceanBase在支付寶出現問題,我會去跳樓。”
原生分布式解決的第二個問題是補齊“分析能力”。
簡單來說,以交易場景為例,數據庫只做兩件事,一是記賬、轉賬,這被稱為“事務處理”——OLTP;第二是算賬,這被稱為“事務分析”——OLAP。數據庫誕生起主要以事務處理為主,對于分析的需求很少,后來隨著數據規模的增大,分析型需求涌現。
傳統的事務處理型數據庫,需要構建獨立的分析系統,從而產生兩套數據庫系統。這不但提高了成本,而且數據傳輸存在延時,不能滿足有強時效性分析的業務場景。
而分布式架構可以用一套數據庫同時實現OLTP+OLAP的業務,即當下大火的“HTAP”能力。根據墨天輪數據,目前國內前六大數據庫均為HTAP+分布式架構,包括PingCap TiDB、華為openGauss、達夢、螞蟻OceanBase、華為GaussDB、阿里云PolarDB。
其中,OceanBase分別在事務處理型基準測試 (TPC-C) 與數據分析型基準測試 (TPC-H) 中獲得冠軍,成為唯一在事務處理和數據分析兩個領域測試中都獲得第一的中國自研數據庫。

3.云+開源,出海的兩記助攻

國產數據庫出海,技術大航海時代的冒險與底氣
如果說,過去十年是國產數據庫公司基于分布式架構修煉內功,那么最近兩年一些“云+開源”的成熟,則是給國產數據庫出海送出了兩記助攻。
在8月10日的OceanBase 4.0發布會上,OceanBase CEO楊冰首次公開了OceanBase的“三級火箭增長引擎”,分別為核心系統升級、全面上云、業務出海。
國產數據庫出海,技術大航海時代的冒險與底氣
云數據庫,就是數據庫廠商將其服務托管在云平臺上,天然擁有云計算的彈性能力,兼具數據庫的易用、開放特點,以及傳統數據庫的管理和處理性能等,是新業務上云的最佳選擇。
云廠商都在自研數據庫。2014年,亞馬遜發布業內首個云數據庫Aurora,阿里云2017年啟動自研云數據庫PolarDB,微軟2019年宣布將在其Azure云平臺上托管新SQL數據服務,谷歌今年5月發布兼容PostgreSQL的AlloyDB。
獨立的數據庫廠商在也證明云數據庫的威力。2020年上市的Snowflake,是當年美股最大IPO,市值一度超過300億美元,其核心商業模式就是把數據倉庫 (OLAP的數據庫) 搬到了云上。
據Gartner預測,到2022年,云數據庫的收入將占數據庫市場總收入的50%,比2020年預測的提前了一年。
云數據庫掀起了數據庫行業的一場革命。在DB-Engines最新的數據庫市場排名中,曾經雄霸榜首近十年的Oracle,先后被微軟與亞馬遜反超,已經跌落到第三名。
國產數據庫出海,技術大航海時代的冒險與底氣
對于國 產數據庫而言,上云所帶來的新的商業模式,也大大降低了出海的門檻。
OceanBase CEO楊冰告訴「甲子光年」:“傳統的本地部署的售賣模式,對于出海當地的交付能力要求非常高。本身我們在國內的服務體系還在成熟與打磨,作為創業公司如果在海外也做這樣重的交付,肯定是比較吃力的。”
相比之下,在云數據庫的模式下,數據庫廠商可以把云廠商變為自己的渠道商,企業付費給IaaS廠商,IaaS廠商再分一部分給數據庫廠商。
目前,國產數據庫公司已經開始與云廠商積極展開合作。
OceanBase不僅支持阿里云的部署,AWS版本在這個月底上線邀測,過去一年的公有云收入已經實現300%的增長;PingCap旗下的TiDB也已經上線阿里云、谷歌云。
值得一提的是,獨立數據庫廠商不可避免地要與云廠商的自研數據庫做競爭,形成亦競亦合的微妙關系。對此,楊冰告訴「甲子光年」:“首先我們會與云廠商做朋友,這在今天幾乎成為一個共識;其次我們入駐云廠商合作的同時,也會保證有自己的品牌與入口。站在客戶的視角,他們也不想被一家云廠商綁定,往往會傾向選擇一家云中立的數據庫。我們要做的就是更好地幫助客戶實現簡單、易用的多云管理。”
云數據庫之外,推動國產數據庫出海的第二記助攻,在于“開源”。
與開源數據庫相對應的是商業數據庫。商業數據庫由廠商提供完善的部署、運維解決方案,通常不開放源代碼,成本也更高,比如Oracle、IBM等;而開源數據庫則是將源代碼開放,用戶可以在源代碼的基礎上進行功能的自定義擴展。
從2014年起,巨杉SequoiaDB、PingCap TiDB、百度Doris、濤思數據Tdenginc、華為openGausss、阿里云PolarDB、螞蟻OceanBase等相繼宣布開源。
2021年1月,根據DB-Engines數據,全球數據庫開源許可證流行度首次超過商業許可證,開源數據庫成為行業主流。
軟件產品研發“唯快不破”,開源有助于強化數據庫生態建設,通過運營開源社區快速獲得反饋,并加快產品研發、提升產品質量,同時反哺社區開發者與ISV生態伙伴。PingCap曾分享過TiDB的數據,其40%的代碼來自外部貢獻者。
同時,開源意味著開放,有利于海外市場的拓客。弓子介告訴「甲子光年」:“開源非常有利于打消當地企業對于一款來自中國數據庫的顧慮,因為核心代碼都能看到。”OceanBase開放了300萬行核心源代碼,包含分布式數據庫的全部特性。
將開源與云相結合,讓當下的國產數據庫出海,比以往任何一個時代都有更多的機會。
但在具體的出海路徑上,也出現了不同的選擇。

4.進擊東南亞!

國產數據庫出海,技術大航海時代的冒險與底氣
國產數據庫出海通常會有兩個市場選擇,一是更加成熟的歐美市場,二是離我們更近的東南亞市場。
歐美市場是數據庫行業的制高點,這里是Oracle、IBM、微軟、谷歌、AWS等國際數據庫巨頭的大本營,也是商業化難度最大、最有挑戰性的市場。
但最有挑戰性的市場也往往是最有說服力的市場。因此,國產數據庫公司都在積極地通過開源社區做布道,做一些標桿客戶。
歐美市場往往也是數據庫技術趨勢最為領先的市場,一個最直觀的感受是,當國內機構更多關注OLTP、OLAP等傳統領域的評估之時,海外關注更多的則是云數據庫、開源、數倉、AI與自動化等趨勢。
向世界級的技術趨勢看齊,是國產數據庫出海的重要意義。為此,OceanBase今年在美國灣區開的第一次meetup,就起了一個名字叫Multicloud DataBase (多云數據庫)
在國內打磨產品,去歐美拿下標桿客戶,再去日韓做變現,是很多數據庫創業公司的市場化路徑。
另外一個商業化路徑更快、需求也更急迫的市場,是東南亞。
雖然市場空間的絕對值不如歐美,但東南亞市場是一個潛力巨大的藍海市場,在東盟十國里,印尼、越南和菲律賓都是人口過億的國家。
弓子介告訴「甲子光年」:“東南亞現階段的互聯網水平很像15、16年的中國,網民數量還在高速增長,這個階段正是互聯網業務激增、傳統業務展開數字化轉型的階段,而國產數據庫就是在國內的這種環境打磨、成長起來的,產品的PMF非常契合東南亞市場。”
東南亞市場企業遇到的挑戰,國產數據庫已經在國內完整地經歷過不止一遍。國產數據庫通過穩定可靠、HTAP、高性價比的中國技術,來幫助東南亞企業核心系統升級,是一場正在發生的故事。
菲律賓第一大電子錢包GCash的基礎設施主管John Vincent R.Biscocho在OceanBase發布會上做了分享,他表示GCash的痛點在于,隨著業務爆發式增長,GCash先前使用的MySQL集群已達存儲上限,每周基本都要進行通宵拆庫和數據清理,導致業務頻繁宕機,每次需要停機2~3小時。此外還有與日俱增的運維成本。
GCash在遷移到OceanBase數據庫之后,存儲成本下降了70%,資源成本降低了40%,并且采用三可用區高可用架構,任意可用區級別故障業務不中斷。
GCash是一個東南亞本土企業的代表性案例。除此之外,很多國內的跨境電商、智能制造、互聯網等企業也在向東南亞出海。隨著海外業務開展,這些企業使用數據庫的類型、數量也會不斷增多,帶來多數據庫管理、多云管理的運維壓力。
國產數據庫出海,技術大航海時代的冒險與底氣
致歐家居將海外的業務系統放在了AWS上。 通過OceanBase橫向擴展的能力,致歐家居跳過了分庫分表的階段,并通過一套數據庫系統連接歐洲AWS、北美AWS、日本AWS,對數據進行融合匯聚。 最終,研發效率提升了100%,資源利用率提高了20%。
國產數據庫,正在一步一步點亮出海的技能樹。
不可否認的是,數據庫出海仍然是一個難度極高的故事,文化差異、安全合規、地緣政治都是其中的不確定因素。
但從無到有、從小到大,中國技術出海本來就是一個漫長的征程。
在社交、跨境電商等出海領域,中國已經走出了抖音、SHEIN等優秀的企業。這一次,國產數據庫出海,能否在難度更高的基礎軟件乃至更廣泛的應用軟件領域,書寫一個新的中國故事?

本文來自微信公眾號“甲子光年”(ID:jazzyear),作者:趙健,36氪經授權發布。

0
相關文章
最新文章
查看更多
關注 36氪企服點評 公眾號
打開微信掃一掃
為您推送企服點評最新內容
消息通知
咨詢入駐
商務合作