當(dāng)前位置:首頁 >  站長 >  數(shù)據(jù)庫 >  正文

OceanBase,分布式數(shù)據(jù)庫“布道者”

 2021-09-15 10:53  來源: A5專欄   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競價(jià),好“米”不錯(cuò)過

最近的數(shù)據(jù)庫行業(yè)熱鬧非常。

一邊是國產(chǎn)數(shù)據(jù)庫崛起的聲音?!?020網(wǎng)信自主創(chuàng)新調(diào)研報(bào)告》顯示,國產(chǎn)數(shù)據(jù)庫在國內(nèi)的市場份額提升至8%-10%,在黨政、金融、電信等多個(gè)關(guān)鍵領(lǐng)域開始規(guī)?;瘧?yīng)用。在Gartner發(fā)布的2020 年度全球數(shù)據(jù)庫魔力象限中,中國數(shù)據(jù)庫首次進(jìn)入第一象限。

在數(shù)據(jù)庫于金融、電信這些“重”、“大”領(lǐng)域馳騁的同時(shí),一些聲音被忽略了——“自建數(shù)據(jù)庫的成本大嗎?有沒有必要選擇自建數(shù)據(jù)庫?”它們來自中國大量的中小企業(yè),對它們來說,這些問題相當(dāng)迫切,也相當(dāng)普遍。

9月11日,全球創(chuàng)業(yè)者峰會(huì)上有人將這兩種“聲音”聚合到了一起。螞蟻集團(tuán)旗下獨(dú)立的數(shù)據(jù)庫公司北京奧星貝斯(OceanBase)發(fā)布了“創(chuàng)計(jì)劃”,首期全免費(fèi)為100家中小企業(yè)提供數(shù)據(jù)庫升級服務(wù)。

在數(shù)據(jù)庫的國產(chǎn)化之路上,中小企業(yè)們從不是無關(guān)緊要的角色,甚至是重要的推動(dòng)者,OceanBase明白這個(gè)道理。

開放者

9月10日、11日,全球創(chuàng)業(yè)者峰會(huì)在北京召開。就在這個(gè)會(huì)議的前兩天,北京市召開優(yōu)化營商環(huán)境“十四五”規(guī)劃新聞發(fā)布會(huì),講述了一系列對中小企業(yè)的扶持計(jì)劃。時(shí)間再往前,是扶持“專精特新”中小企業(yè)的北交所成立。

在這個(gè)意義非凡的大會(huì)上,一家剛成立一年名為OceanBase的數(shù)據(jù)庫企業(yè)被邀請參加主論壇發(fā)言。9月11日,OceanBase(以下簡稱“OB”)的CEO楊冰發(fā)布了一個(gè)相當(dāng)“大膽”的計(jì)劃,免費(fèi)幫中小企業(yè)提供數(shù)據(jù)庫服務(wù),首期開放100個(gè)名額。

在他的計(jì)劃中,這只是OB創(chuàng)計(jì)劃的首期,希望通過首期這100個(gè)樣本總結(jié)出一套為中小企業(yè)技術(shù)服務(wù)的模版,從而在接下來二期三期中更好地服務(wù)更多的中小企業(yè)。

數(shù)據(jù)庫同芯片、操作系統(tǒng)一道,都是相當(dāng)重要的IT軟件,甚至有人說“沒有數(shù)據(jù)庫,就沒有企業(yè)的根本”。但在這個(gè)投資人眼中快公司才有價(jià)值的年代,對創(chuàng)業(yè)者和中小企業(yè)來說,底層技術(shù)的搭建注定漫長,從0開始難于登天,很多人只能求助于開源或免費(fèi)數(shù)據(jù)庫。

OB的創(chuàng)計(jì)劃,針對的就是這些中小企業(yè)。除了1T數(shù)據(jù)量以外,這個(gè)計(jì)劃沒有門檻,“只要報(bào)了名說是我們的開源客戶,希望得到幫助,我們就會(huì)派出專業(yè)的人員去做架構(gòu)咨詢,去教如何使用,幫助客戶上線后也會(huì)再提供一些售后保障機(jī)制”,楊冰向《一點(diǎn)財(cái)經(jīng)》表示。

其實(shí),早在3個(gè)月前,OB還做了一件大事,那就是開源。

今年6月1日,OB采用木蘭協(xié)議全面開放內(nèi)核,在Gitee、Github上進(jìn)行代碼托管,同時(shí)成立OceanBase開源社區(qū),300萬行核心代碼向社區(qū)開放。以此,OB從閉源軟件走向了開源。

在開源、創(chuàng)計(jì)劃連續(xù)兩個(gè)動(dòng)作背后,OB正在走出螞蟻,變得越來越開放。它開放的底氣何在?

革命者

“看著同樣是車,但其實(shí)特斯拉和油車不是一個(gè)時(shí)代的產(chǎn)物,未來特斯拉可能就沒有方向盤了”,9月10日,楊冰在北京新國展附近向《一點(diǎn)財(cái)經(jīng)》如此通俗地解釋OB的分布式數(shù)據(jù)庫與其他數(shù)據(jù)庫質(zhì)的不同。

OB成立得比特斯拉還早,至今已有十一年的時(shí)間,但同特斯拉一樣,OB生于“不滿足”。那時(shí),淘寶還沒有騰飛,螞蟻還在初創(chuàng),但一些東西正在悄悄萌芽,其中就有2010年成立的OB。

當(dāng)時(shí)的數(shù)據(jù)庫有兩個(gè)背景:第一,數(shù)據(jù)庫技術(shù)本質(zhì)上受場景驅(qū)動(dòng),上世紀(jì)開始IT行業(yè)最先發(fā)展起來的美國也最先發(fā)展起了數(shù)據(jù)庫,隨后幾乎壟斷了全球數(shù)據(jù)庫行業(yè)。第二,隨著21世紀(jì)以來中國計(jì)算機(jī)行業(yè)的快速發(fā)展乃至超越,中國有了革新數(shù)據(jù)庫的行業(yè)基礎(chǔ)和訴求。

淘寶是做電商的,隨著電商業(yè)務(wù)的推進(jìn),曾任淘寶高級研究員的陽振坤發(fā)現(xiàn)了一個(gè)現(xiàn)象:傳統(tǒng)數(shù)據(jù)庫處理的是封閉物理世界的場景,但像淘寶這樣的線上商城沒有物理邊界,無論是數(shù)據(jù)量、請求量、訪問用戶都是天南地北不被限制的,因此必須打破并重新設(shè)計(jì)數(shù)據(jù)庫。

“做這個(gè)的初心其實(shí)是做一個(gè)未來的數(shù)據(jù)庫,陽老師(陽振坤)認(rèn)為現(xiàn)在的數(shù)據(jù)庫技術(shù)很難去適應(yīng)未來的時(shí)代。第二也是有情懷在,總覺得在中國的軟件領(lǐng)域也應(yīng)該有一些比較硬核的自主品牌出現(xiàn),而數(shù)據(jù)庫是軟件當(dāng)中除操作系統(tǒng)以外最難的。”楊冰如此解釋OB的由來。

一開始,他們想基于一個(gè)開源數(shù)據(jù)庫去重新設(shè)計(jì),但對市面上的數(shù)據(jù)庫摸了一圈之后,發(fā)現(xiàn)找不到符合自己要求的,頂層設(shè)計(jì)不一樣,所以開始從0開始設(shè)計(jì)出OB。它基于Paxos 協(xié)議和分布式架構(gòu),構(gòu)建在通用服務(wù)器集群上,不依賴特定硬件架構(gòu)。

重新設(shè)計(jì)的OB,可能使用感跟傳統(tǒng)數(shù)據(jù)庫一樣,但內(nèi)核里已完全不同,楊冰用“scale out”(線性擴(kuò)展)和“scale up”(增大)兩個(gè)詞匯來描述兩者的差異。

傳統(tǒng)數(shù)據(jù)庫像一輛燃油車一樣,當(dāng)覺得馬力不足的時(shí)候可以scale up,裝更多的配件,從8缸到12缸,但再怎么多裝,都只能在車的容限里。而OB可以scale out實(shí)現(xiàn)線性擴(kuò)展,能力不夠了可以加服務(wù)器,單個(gè)硬件本身的能力沒那么強(qiáng),但整合起來沒有天花板。

“我們用分布式數(shù)據(jù)庫通過了傳統(tǒng)集中式數(shù)據(jù)庫最嚴(yán)苛的測試標(biāo)準(zhǔn),甲骨文做到了每秒鐘3000萬,而我們做到7.07億,成為唯一在事務(wù)處理和數(shù)據(jù)分析兩個(gè)領(lǐng)域測試中都刷新世界記錄的中國自研數(shù)據(jù)庫。”全球創(chuàng)業(yè)者峰會(huì)上,楊冰介紹道。

生長土壤的根本性差異,決定了OB的革命性不同。與傳統(tǒng)數(shù)據(jù)庫相比,OB能夠幫企業(yè)降低50%-80%的成本,規(guī)模越大,降低效果越明顯。

走出螞蟻

對分布式數(shù)據(jù)庫來說,一致性是重要考驗(yàn),而OB通過采用Paxos 協(xié)議解決了一致性問題。Paxos這個(gè)理論最早由科學(xué)家Lamport提出,后來Google的工程師基于此做了分布式數(shù)據(jù)庫?,F(xiàn)在OB基于金融級場景的打磨會(huì)在一致性和延遲方面做的更極致。

螞蟻?zhàn)龅氖侵Ц?,谷歌做的是搜索場景,也就無法在金融這樣的場景中將一致性做到極致。“我們用了同樣一套論文里面的理念,用自己的方式重新再實(shí)現(xiàn)一遍,雖然參照一樣的東西,但放在支付寶這種場景里就可以模擬出來,可以做得更強(qiáng)”,楊冰表示。

雖然現(xiàn)在分布式數(shù)據(jù)庫成為行業(yè)公認(rèn)的未來,成為兵家必爭之地,但其實(shí)一開始,哪怕在螞蟻內(nèi)部,對數(shù)據(jù)庫應(yīng)該怎么走,哪個(gè)方向才是未來這些問題都是有疑惑的,在阿里和螞蟻內(nèi)部,做數(shù)據(jù)庫的團(tuán)隊(duì)也不只一個(gè)。OB就是在這種千軍萬馬過獨(dú)木橋的氛圍中一路走過來,研發(fā)最艱難的時(shí)候,幾乎就沒有人敢用OB,團(tuán)隊(duì)也經(jīng)歷過至暗時(shí)刻,但最終還是熬出來了,并最終取得了勝利。

除了技術(shù)先進(jìn)性和路線的正確性,OB的發(fā)展還離不開螞蟻等業(yè)務(wù)場景的支持。一開始淘寶收藏夾最先表達(dá)了對OB的支持,但當(dāng)時(shí)的OB還沒有那么強(qiáng),找到一兩個(gè)場景后無法繼續(xù)推廣了,陽振坤向阿里云計(jì)算創(chuàng)始人王堅(jiān)求助,后者幫忙說服了當(dāng)時(shí)的螞蟻集團(tuán)CTO程立。

那時(shí),螞蟻集團(tuán)可以說是當(dāng)時(shí)中國使用Oracle最多的一家互聯(lián)網(wǎng)公司,而螞蟻又在實(shí)行去IOE(Oracle 的標(biāo)配是 IBM 的小型機(jī)和 EMC 的存儲(chǔ)硬件)戰(zhàn)略,需要找到替代的數(shù)據(jù)庫,尤其是自己的數(shù)據(jù)庫。

OB第一次在螞蟻的亮相可謂完美。螞蟻原本計(jì)劃給OB 1%的業(yè)務(wù)量,但預(yù)估之后發(fā)現(xiàn)Oracle扛不住,最后給了OB10%的業(yè)務(wù)量。“這個(gè)時(shí)候OB也沒有別的選擇,就來吧,結(jié)果OB頂過去了,一戰(zhàn)成名,走過了至暗時(shí)刻”,楊冰回憶道。

OB的發(fā)展到可以分為三個(gè)階段,1.0時(shí)代是從2010年成立到找到淘寶收藏夾,再轉(zhuǎn)戰(zhàn)支付寶第一個(gè)核心交易系統(tǒng)上線;2.0時(shí)代是在支付寶內(nèi)部不斷打磨金融場景,實(shí)現(xiàn)支付寶核心業(yè)務(wù)對Oracle的替換,得到外部客戶的認(rèn)可;3.0時(shí)代是正式走出螞蟻。

2020年6月,隨著內(nèi)部打磨和考驗(yàn)的完成,OB開始走出螞蟻,在北京成立獨(dú)立公司,除了螞蟻時(shí)期就十分上手的金融企業(yè),還開始接觸運(yùn)營商、能源電力等傳統(tǒng)企業(yè),以及跨境電商等互聯(lián)網(wǎng)企業(yè),甚至開始有海外企業(yè)合作。

在楊冰看來,過去十年OB是通過內(nèi)部 “喂”出來、磨出來的,未來隨著走出螞蟻,進(jìn)一步打磨OB的產(chǎn)品成熟度,把它推向世界。

數(shù)據(jù)庫國產(chǎn)化野心

陽振坤常常提到一個(gè)說法,一個(gè)技術(shù)產(chǎn)品要長遠(yuǎn)發(fā)展,必須“頂天立地”,所謂“頂天”,是技術(shù)先進(jìn)性,所謂“立地”,是產(chǎn)品化、商業(yè)化、通用化。毫無疑問,OB是“頂天立地”的信奉者。

OB走出螞蟻的過程,其實(shí)就是它產(chǎn)品化、商業(yè)化的過程。

對一個(gè)以技術(shù)為基石的企業(yè)來說,這無疑是相當(dāng)有挑戰(zhàn)性的??钙餙B產(chǎn)品化、商業(yè)化重任的楊冰,就直言經(jīng)歷了一兩年的過渡期。“從去年成立一個(gè)商業(yè)化團(tuán)隊(duì)之后,我們在決策導(dǎo)向和引導(dǎo)導(dǎo)向上強(qiáng)調(diào)客戶第一,讓大家做事情不要自high。”

原來,技術(shù)埋頭做技術(shù)就好,但現(xiàn)在,他們不得不更多地聽來自外界的聲音,走出辦公室,去客戶企業(yè)里聽從他們的需求和聲音,在客戶要求下做產(chǎn)品的改進(jìn)。曾經(jīng)技術(shù)為主的30人團(tuán)隊(duì),如今發(fā)展成500人,其中有專精技術(shù)的,也有既懂技術(shù)也懂產(chǎn)品的復(fù)合型人才。

OB策略一開始是高舉高打,樹立標(biāo)桿,它合作的企業(yè)中有銀行、證券、石油、電力、運(yùn)營商等企業(yè),都算是大型企業(yè),也是對數(shù)據(jù)和技術(shù)要求高的企業(yè)。截至目前,OB合作了上百家企業(yè)。

隨著今年開源和“創(chuàng)計(jì)劃”的實(shí)施,OB的步子越邁越大。楊冰向《一點(diǎn)財(cái)經(jīng)》透露,明年OB計(jì)劃推出4.0版本,其特性是輕量化更好,會(huì)更適合中小微企業(yè)。“到時(shí),OB會(huì)像金箍棒一樣,能長就長,能短就短。”

通過一高一低兩端共同推進(jìn),OB在做大企業(yè)時(shí),爭取更多的認(rèn)同者、追隨者,在中國乃至全球進(jìn)行分布式數(shù)據(jù)庫布道,共同推進(jìn)國產(chǎn)分布式數(shù)據(jù)庫的發(fā)展,改變數(shù)據(jù)庫為外國企業(yè)引領(lǐng)乃至占據(jù)的局面,這是OB的數(shù)據(jù)庫國產(chǎn)化夢想。

近二三十年,數(shù)字世界欣欣向榮,無論個(gè)人還是企業(yè)都放棄了紙筆,將電腦和軟件作為了生產(chǎn)工具,在持續(xù)的產(chǎn)業(yè)數(shù)字化背景下,數(shù)據(jù)庫的重要性不言而喻。自一開始就生于“不滿足”的OB,想做得更“出格”一點(diǎn)。

要實(shí)現(xiàn)這個(gè)終極目標(biāo),推動(dòng)國產(chǎn)數(shù)據(jù)庫,首先要做的是長期保持技術(shù)的先進(jìn)性。據(jù)楊冰所說, OB是產(chǎn)品先行,會(huì)長期遵行技術(shù)優(yōu)先。

結(jié)語

操作系統(tǒng)、芯片、數(shù)據(jù)庫,是IT三大重要部分,也是中國創(chuàng)新企業(yè)發(fā)展的三大攔路虎。曾經(jīng),它們的共同特性是被國外廠商所占據(jù),中國企業(yè)只能在此基礎(chǔ)上做優(yōu)化和調(diào)整。如今,操作系統(tǒng)和芯片國產(chǎn)化已經(jīng)在路上,數(shù)據(jù)庫國產(chǎn)化正在崛起。

中國全球領(lǐng)先的互聯(lián)網(wǎng)、數(shù)據(jù)產(chǎn)業(yè),為數(shù)據(jù)庫的國產(chǎn)化提供了天然土壤。彎道超車,最有可能在這里實(shí)現(xiàn)。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
數(shù)據(jù)庫

相關(guān)文章

熱門排行

信息推薦