国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

圖行業(yè)的一些觀察:以圖數(shù)據(jù)庫(kù)為例|NUC 2022

吳敏
+ 關(guān)注
2022-12-20 14:14
622次閱讀

本次分享的內(nèi)容本來是圖行業(yè)發(fā)展及標(biāo)準(zhǔn)的深度解讀,這其實(shí)是個(gè)很大的話題,所以我把標(biāo)題換成了一個(gè)小一點(diǎn)的標(biāo)題。因?yàn)槲矣X得整個(gè)圖行業(yè)它其實(shí)是一個(gè)非常大的行業(yè)。每個(gè)人在里面其實(shí)只是在盲人摸象,我可能只是摸過大腿而已,其他部分我也沒有摸過。說不上做一個(gè)深度的解讀,只是說我在這個(gè)行業(yè)的一些觀察,因?yàn)槲矣X得我只摸過四條大腿的其中一條,所以又加一個(gè)副標(biāo)題,以圖數(shù)據(jù)庫(kù)為例。

圖的思想,哪怕這個(gè)術(shù)語(yǔ)出現(xiàn)的很晚,但是人類早就已經(jīng)有這個(gè)概念了,或者早就已經(jīng)有這個(gè)認(rèn)知了。就是大家會(huì)發(fā)現(xiàn)其實(shí)光有這些零散的知識(shí)是不夠的,需要把這些知識(shí)給關(guān)聯(lián)起來,關(guān)聯(lián)之后才能變成指導(dǎo)我們?nèi)粘I畹慕?jīng)驗(yàn)。所以一個(gè)概念很早的時(shí)候就已經(jīng)有了:"關(guān)聯(lián)"是很重要的。

Graphs-are-everywhere

我剛才說圖這個(gè)領(lǐng)域是非常非常的大,在 2020 年的時(shí)候,有一家公司GraphAware,他曾經(jīng)嘗試想把整個(gè)圖領(lǐng)域里面的一些公司或者產(chǎn)品給列舉一下,這其實(shí)是很難的,因?yàn)閷?shí)在太多了。他大概做了一個(gè)分類,有基礎(chǔ)設(shè)施的、應(yīng)用的、開發(fā)者工具的,還有一些會(huì)議之類的。比如說在20年的時(shí)候,當(dāng)時(shí)有NebulaGraph、GQL、DGL了,這些都是我們今天可以聽到的。其實(shí)想把整個(gè)圖完全整理出來是挺難的,我稍微做了一點(diǎn)點(diǎn)總結(jié)和濃縮。在圖領(lǐng)域的話,大概有四個(gè)大的部分:基礎(chǔ)設(shè)施、開發(fā)者工具、應(yīng)用和信息資源。

圖領(lǐng)域的公司和產(chǎn)品Graph-Technology-Landscape

圖數(shù)據(jù)庫(kù)的行業(yè)版圖:基礎(chǔ)設(shè)施、開發(fā)者工具、應(yīng)用和信息資源

像基礎(chǔ)設(shè)施的部分,比如說今天我們要談的 Graph Database,還有一些可能會(huì)涉及到圖 Processing 和 Computing 的系統(tǒng)。然后像圖神經(jīng)網(wǎng)絡(luò)、可視化分析和云服務(wù)商,這些基本可以分類為整個(gè)圖領(lǐng)域的基礎(chǔ)設(shè)施部分,他們是基礎(chǔ)設(shè)施的提供商。

然后接下來說開發(fā)者工具,一般主要是建模的工具,圖分析和可視化的函數(shù)庫(kù)、工具或者 SDK,還有一些 BI 場(chǎng)景的工具。當(dāng)然還有其他的一些開發(fā)者工具,就不一一列舉了。

還有應(yīng)用領(lǐng)域,比如說圖譜。圖譜本身是一個(gè)很大的領(lǐng)域,圖只是為圖譜提供一些基礎(chǔ)設(shè)施的服務(wù)。還有一些常見的,比如說欺詐檢測(cè)、網(wǎng)絡(luò)安全,或者是社交網(wǎng)絡(luò)、商業(yè)網(wǎng)絡(luò)的圖。這些是圖比較常見的一些應(yīng)用領(lǐng)域。

還有一些是圖領(lǐng)域的信息資源。比如會(huì)議、書籍、論文。九月份的時(shí)候,VLDB 的 Research Session,大概有 1/5 都是和圖相關(guān)的;還有今天我們的 NUC,這也是圖領(lǐng)域的一個(gè)會(huì)議。還有一些國(guó)際化的組織,比如說像國(guó)際化的 ISO、IEC,他們?cè)跒閲?guó)際標(biāo)準(zhǔn)做一些努力。還有一些民間的組織或者第三方的組織,比如說 LDBC,可以為這個(gè)領(lǐng)域的發(fā)展做一些貢獻(xiàn)。這些挺好地反映了圖行業(yè)現(xiàn)在的成熟程度。

圖這個(gè)話題還是挺大的,所以先看一點(diǎn)簡(jiǎn)單的歷史。可能大家都聽說過七橋問題,或者是西爾威斯特提出的矩陣和圖論這兩個(gè)名詞,這都是歷史上的概念,不是我們計(jì)算機(jī)學(xué)科要談的。

1960-1980s: 數(shù)據(jù)模型與數(shù)據(jù)系統(tǒng)的定義

計(jì)算機(jī)系統(tǒng)里面的圖,有這么一個(gè)歷史,在 60-80 年代的時(shí)候,其實(shí)大家的主要工作都是著重在圖模型和數(shù)據(jù)系統(tǒng)該怎么定義上面。最早我能查到的是巴赫曼,1960 年的時(shí)候,當(dāng)時(shí)他在 GE 的開關(guān)電器廠工作,發(fā)明了 IDS 系統(tǒng)。這個(gè)系統(tǒng)對(duì)后世所有的數(shù)據(jù)管理系統(tǒng)都有很大的影響。巴赫曼應(yīng)該是最早的先驅(qū),當(dāng)時(shí)他所采用的模型后面被稱為稱為 Network Model 或者 Network Data Model。它本身的特點(diǎn)是把記錄 record 通過Linkage 關(guān)聯(lián)起來。比如上面這個(gè)例子,一個(gè)記錄可以和很多其他的記錄相互關(guān)聯(lián)。這應(yīng)該是在計(jì)算機(jī)系統(tǒng)里面最早實(shí)現(xiàn)的一個(gè)圖模型系統(tǒng)。當(dāng)然后來巴赫曼獲得了圖靈獎(jiǎng)。

1970年代科德發(fā)明關(guān)系模型

60年代的時(shí)候,大家重點(diǎn)工作是放在圖或者網(wǎng)絡(luò)模型上面。到70年代的時(shí)候,最著名的成果就是科德發(fā)明的關(guān)系模型了。從關(guān)系模型到關(guān)系代數(shù),一路演變成了RDBMS的這一整套技術(shù)。科德在70年代發(fā)明的關(guān)系模型相比60年代的網(wǎng)絡(luò)模型,他認(rèn)為自己的進(jìn)步在哪里:就是60年代的網(wǎng)絡(luò)模型,或者說那個(gè)時(shí)候的圖系統(tǒng),只能夠處理一系列確定主鍵的記錄之間的關(guān)聯(lián);而他所發(fā)明的這個(gè)Relational Model,他可以對(duì)任意的值進(jìn)行匹配。如果用數(shù)據(jù)庫(kù)的話,就是value-based join。這樣整個(gè)模型會(huì)更加地通用。因此在后來很長(zhǎng)的一段時(shí)間,可能有三四十年的歷史里面,RDBMS基本上主導(dǎo)了整個(gè)數(shù)據(jù)處理市場(chǎng)。

1980-90年代的Logical-Data-Model

整個(gè)圖相關(guān)的模型還在繼續(xù)往前走,比如說到 80-90 年代的時(shí)候,有了Logical Data Model。再比如說標(biāo)簽圖或者標(biāo)簽網(wǎng)絡(luò),這也是現(xiàn)在我們常用的 LPG(labelled property graph)概念中的一部分。因?yàn)?90 年代的時(shí)候面向?qū)ο蠛芰餍校灿腥藝L試想把面向?qū)ο蟮倪@個(gè)概念引入到數(shù)據(jù)庫(kù)系統(tǒng)里面,比如說數(shù)據(jù)庫(kù)原來已經(jīng)有這些ACID的功能,嘗試想把這種多態(tài)、繼承或者封裝功能引入到數(shù)據(jù)庫(kù)系統(tǒng)里面。當(dāng)然,其實(shí)多態(tài)或者繼承本身也是帶一定的圖關(guān)系的,當(dāng)然今天看有些探索并不是成功,但也是往前的一些進(jìn)步。

大約在05年的時(shí)候,后來的 Neo4j 首席執(zhí)行官 Emil Eifrem 聽說在哈佛有個(gè)軟件挺流行的,叫 The Facebook Social Graph,然后他覺得自己正在做的一個(gè)媒體管理軟件也是一個(gè) Graph 結(jié)構(gòu)。他當(dāng)時(shí)在飛機(jī)上,突然就靈光一閃,自創(chuàng)了一個(gè)新的名詞 Graph Database。這應(yīng)該是我能查到的這個(gè)單詞(Graph Database)最早的起源了,后來這個(gè)名詞也是過了很久才慢慢為大家所知。

到12年的時(shí)候工業(yè)界大部分采用的是 Labelled Property Graph模型。相比基本的網(wǎng)絡(luò)模型做了一些擴(kuò)充,比如說 label 加上了,把 property 加上了,這個(gè)概念到今天為止也是在圖數(shù)據(jù)庫(kù)這個(gè)領(lǐng)域里面比較常見的模型之一。另外一個(gè)比較常見的模型就是 W3C 為 RDF 所做的這一套定義。這兩種模型到目前為止還是比較常見的。

整個(gè)數(shù)據(jù)模型還在繼續(xù)向前進(jìn)步,大約到18年左右的時(shí)候,嘗試為圖或者網(wǎng)絡(luò)的模型添加 streaming 或者 temporal 的時(shí)序能力。相關(guān)工作還在繼續(xù)開展,也有一些論文再發(fā)布,能看到一些相關(guān)產(chǎn)品。

2010s: 圖數(shù)據(jù)庫(kù)與圖計(jì)算系統(tǒng)的相互促進(jìn)

圖數(shù)據(jù)庫(kù)行業(yè)的發(fā)展曲線

剛才提到的這些模型,可能是很久之前的歷史了。大約在2010年前后開始,在圖這個(gè)模型里面,出現(xiàn)了兩個(gè)比較重要的分支,圖數(shù)據(jù)庫(kù)系統(tǒng)和圖計(jì)算系統(tǒng)。這兩個(gè)分支先是獨(dú)立發(fā)展,之后是相互促進(jìn)。雖然數(shù)據(jù)模型是一步步演進(jìn)過來的,但是圖數(shù)據(jù)庫(kù)和圖計(jì)算系統(tǒng)兩種系統(tǒng)最初是各自獨(dú)立發(fā)展的。

圖數(shù)據(jù)庫(kù)系統(tǒng)基本上和數(shù)據(jù)庫(kù)系統(tǒng)的關(guān)系會(huì)更大一點(diǎn)。在 2000 年到2010 年之間,圖數(shù)據(jù)庫(kù)系統(tǒng)基本上還是 NoSQL 系統(tǒng)中的一種嘗試。他們面對(duì)的還是想解決 RDBMS 中有些不好解決的一些小的細(xì)分領(lǐng)域問題。

而圖計(jì)算系統(tǒng),它當(dāng)時(shí)能解決的都是一些小規(guī)模的圖。比如單機(jī)處理一個(gè)圖計(jì)算的場(chǎng)景,或者是使用 Boost 里面的 Graph Library,或者M(jìn)apReduce 來非常原始的方式來實(shí)現(xiàn)圖計(jì)算。

從大概10年開始,兩種系統(tǒng)都得到比較大的發(fā)展。圖數(shù)據(jù)庫(kù)對(duì)于分布式架構(gòu)、多模支持和圖查詢語(yǔ)言設(shè)計(jì)這些方面都開始進(jìn)入技術(shù)成熟階段,也出現(xiàn)了很多新的商業(yè)公司開始進(jìn)入這個(gè)領(lǐng)域。對(duì)于圖計(jì)算系統(tǒng)來說,出現(xiàn)了兩個(gè)比較重要的計(jì)算模型,BSP 模型和 GAS 模型,這兩個(gè)模型使得大規(guī)模并行地分布式圖計(jì)算變得可能。當(dāng)然也產(chǎn)生了一系列圖計(jì)算和分析為主要目的商業(yè)公司。

這兩種系統(tǒng)在 15 年前后,技術(shù)開始相互促進(jìn)和融合。商業(yè)公司會(huì)相互借鑒對(duì)方的技術(shù),把對(duì)方技術(shù)引入自己的產(chǎn)品里,然后去服務(wù)更多的場(chǎng)景。在 15 年前后行業(yè)的入局者開始迅速地增加。不光光是國(guó)外,國(guó)內(nèi)也出現(xiàn)了更多的公司。原有的數(shù)據(jù)庫(kù)公司和云廠商也開始進(jìn)入這個(gè)領(lǐng)域。國(guó)內(nèi)的學(xué)術(shù)機(jī)構(gòu)和產(chǎn)業(yè)界也有比較明顯的進(jìn)步。已經(jīng)可以逐步接近和達(dá)到世界的前列。所以對(duì) 15 年之后的總結(jié)就是技術(shù)上相互促進(jìn),商業(yè)市場(chǎng)已經(jīng)開始增長(zhǎng)。

2018- Graph + AI 的快速興起

然后在 18 年前后,在技術(shù)上又發(fā)生了一些變化。Graph+AI 的領(lǐng)域開始快速興起,這里的 AI 比如說像連結(jié)主義為主的神經(jīng)網(wǎng)絡(luò),或者是符號(hào)主義為主的 Knowledge Graph。

publications-of-graph

world-patents-applications-of-graph

Graph和AI的結(jié)合使得這個(gè)領(lǐng)域出現(xiàn)了很多新的研究。有幾個(gè)例子,一個(gè)是我從Web of Science拉了一下論文的情況。大約從10年到15年左右,Graph Database、Graph Computing、Graph Neural Network和Knowledge Graph總體來說都保持了一個(gè)相對(duì)平穩(wěn)的增長(zhǎng),但是到18年左右,和 AI 相關(guān)的 Graph 的論文數(shù)量就發(fā)生了明顯的提升,這說明了學(xué)術(shù)界研究熱點(diǎn)的變化。還有一個(gè)是專利的情況,這是我從 WIPO 拉取的和 Graph 相關(guān)的專利申請(qǐng)情況。在前期的時(shí)候,Graph Database 和Graph Computing 的專利申請(qǐng)會(huì)明顯多一些。然后到18年左右開始的時(shí)候,和AI相關(guān)的Graph Neural Network和Knowledge Graph專利申請(qǐng)有明顯的提升,這說明了工業(yè)界的變化。一般來說,工業(yè)界會(huì)更關(guān)注專利一些,學(xué)術(shù)界會(huì)更關(guān)注論文一些。可以說Graph+AI在最近這幾年都得到極大的發(fā)展,不管是在學(xué)術(shù)界還是工業(yè)界。

在前期的時(shí)候,Graph Database 和 Graph Computing 的專利申請(qǐng)會(huì)明顯多一些

 多年以來,GraphDBMS都是DB-engines上增速最快的分支

因?yàn)槲覀兿胝劦氖?Graph Database,所以從 Database 領(lǐng)域來簡(jiǎn)單看一下。在 Database 領(lǐng)域有很多的分支,DB-engines 網(wǎng)站會(huì)對(duì)不同的分支品類統(tǒng)計(jì)流行情況,反應(yīng)流行度的增長(zhǎng)趨勢(shì)。比如說 Relational DBMS(下面這個(gè)紅色的曲線),他的基數(shù)已經(jīng)很大,增長(zhǎng)趨勢(shì)不會(huì)很大。但是對(duì)于 Graph DBMS 來說,這么多年以來,都是增速最快的分支。所以從Database這個(gè)角度來看,Graph 領(lǐng)域也是增速最快的。

2013-2022:Hyper Cycle of Graph Databases

2013年Gartner發(fā)布的Hyper Cycle 曲線

然后我還去找了一些研報(bào)或者三方研究機(jī)構(gòu)對(duì)這個(gè)領(lǐng)域的一些看法。其中最著名的就是Gartner。Gartner從13年開始,每年都會(huì)去研究Graph這種領(lǐng)域的進(jìn)展。它有一個(gè)非常著名的 Gartner Hyper Cycle 曲線。簡(jiǎn)單說一下,Gartner 認(rèn)為一個(gè)技術(shù)會(huì)有兩個(gè) Cycle。第一個(gè) Cycle 是從萌芽期進(jìn)入過熱期再進(jìn)入幻滅期,這期間會(huì)有大量的智力和資本進(jìn)入這個(gè)領(lǐng)域。然后第二個(gè) Cycle 是從復(fù)蘇期進(jìn)入成熟期,這個(gè)技術(shù)成為整個(gè)商業(yè)日常運(yùn)營(yíng)的一部分,不再作為一個(gè)新的技術(shù)名詞出現(xiàn)。

Gartner對(duì)Graph DBMS從2013年開始的跟蹤與觀察

圖數(shù)據(jù)庫(kù)GraphDBMS的萌芽期、過熱期和幻滅期

Gartner 對(duì)于 Graph DBMS 從 2013 年開始一直有跟蹤,我把它稍微重新整理了一下。在Gartner看來,整個(gè)Graph領(lǐng)域的情況是這樣子的。大約從13年到16年,這是第一個(gè)Hyper Cycle的萌芽期,大家在嘗試探索說哪些領(lǐng)域或者哪些新的技術(shù)可以被引入和使用。在17年左右的時(shí)候,這是第一個(gè) Cycle 的高峰,之后的三年時(shí)間,進(jìn)入第一個(gè)Cycle的幻滅期。從21年到22年開始進(jìn)入第二個(gè)Cycle的爬升期。根據(jù)Gartner的預(yù)測(cè),他認(rèn)為在未來的3-5年內(nèi),Graph Database 這個(gè)領(lǐng)域會(huì)進(jìn)入一個(gè)技術(shù)的成熟期。

Graph Database 圖數(shù)據(jù)庫(kù)的市場(chǎng)營(yíng)收情況

對(duì)于整個(gè) Graph Database 的市場(chǎng)營(yíng)收情況的一些預(yù)計(jì),不同的研究機(jī)構(gòu)給出的研報(bào)可能不太一樣。但是大體上數(shù)據(jù)都是最近20 21這兩年有十幾億美元的營(yíng)收,并且大約保持 20%+ 的年復(fù)合增長(zhǎng)率。這個(gè)增速大概我看了一下,略高于一點(diǎn)點(diǎn) RDBMS 市場(chǎng)的增速。當(dāng)然這是一個(gè)全球的情況,那如果看國(guó)內(nèi)的情況,獨(dú)立的研報(bào)比較少,但從我們內(nèi)部拿到的數(shù)據(jù)和幾家證券公司給的研報(bào)來看,國(guó)內(nèi)的數(shù)據(jù)應(yīng)該比國(guó)際數(shù)據(jù)的增速至少高一倍以上,內(nèi)部能看到數(shù)據(jù)都是 50%~100%。所以國(guó)內(nèi)會(huì)更樂觀一些,大概可能的原因還是國(guó)內(nèi)相對(duì)基數(shù)更小,導(dǎo)入和起步也更晚一點(diǎn)。

對(duì)于圖數(shù)據(jù)庫(kù)未來的猜想

最后一個(gè)部分是對(duì)未來做一些預(yù)測(cè),當(dāng)然預(yù)測(cè)還是很難的,所以我把它改一個(gè)名詞,叫做猜想。猜想分為三個(gè)部分,一個(gè)技術(shù)部分,一個(gè)產(chǎn)品部分,還有一個(gè)產(chǎn)業(yè)部分。

對(duì)于圖數(shù)據(jù)庫(kù)未來技術(shù)的猜想

關(guān)于圖數(shù)據(jù)庫(kù)未來技術(shù)的猜想

關(guān)于技術(shù)部分,Graph Database 這個(gè)名詞本身其實(shí)已經(jīng)出現(xiàn)快20年了。然后我想引用一個(gè)隱喻:一艘船它的木頭逐漸被全部替代了之后,木頭還是不是原來的木頭,船還是不是原來的船?我想說就是 Graph Database從最初只是一個(gè)Graph Model 外加 Graph Visualization 的一個(gè)數(shù)據(jù)存儲(chǔ)系統(tǒng),到后面逐步增加圖語(yǔ)言 Pattern Matching 能力、大規(guī)模的 Computing 能力,以及對(duì)于業(yè)務(wù)人員用的 Data Science 能力,加上時(shí)序、Neural Network 這些能力。是不是可以考慮為它創(chuàng)造一個(gè)新的技術(shù)名詞了。

關(guān)于圖數(shù)據(jù)庫(kù)未來產(chǎn)品的猜想

關(guān)于圖數(shù)據(jù)庫(kù)未來技術(shù)的猜想

第二個(gè)是產(chǎn)品部分。關(guān)于Graph領(lǐng)域我覺得有一些問題。最前面說到要把知識(shí)串聯(lián)起來才能變成經(jīng)驗(yàn)。對(duì)于任何一個(gè)技術(shù)來說,都有這么一個(gè)Time to Market的過程。先有一個(gè)想法idea,然后要試一試這個(gè)想法行不行。如果這個(gè)想法行,再把它變成一個(gè)生產(chǎn)的部署,最后再進(jìn)行運(yùn)維;如果不行,我可以再返回再來一個(gè)循環(huán)。這整個(gè)過程Time-to-market其實(shí)速度是最重要的。其實(shí)Graph領(lǐng)域來說,它在idea這個(gè)階段是最適合的,因?yàn)榧词箻I(yè)務(wù)人員不懂技術(shù),對(duì)他來說也是很容易理解的,所以可以非常快的產(chǎn)生一個(gè)新想法。但是Graph領(lǐng)域目前的問題是在Create到 Release這個(gè)階段速度太慢。具體來說為什么速度太慢,就是整個(gè)Graph領(lǐng)域的技術(shù)對(duì)于用戶暴露的細(xì)節(jié)還是太多。不管是從OLTP的這個(gè)角度(上面),比如整個(gè)數(shù)據(jù)流的流程很長(zhǎng),加工完數(shù)據(jù)(ETL)要反饋到前面。對(duì)于OLAP這種分析為目的流程,也一樣有個(gè)抄長(zhǎng)的流程。在這樣的整個(gè)流程里面,任何一個(gè)環(huán)節(jié)即使技術(shù)上極大進(jìn)步,進(jìn)步1倍或者10倍,但對(duì)于整個(gè)流程,特別是對(duì)于整個(gè)Time to Market的流程,其實(shí)可能只提升了5%。

另外一個(gè)問題是人員,因?yàn)槿绻麑?duì)于一些小型的公司來說,他需要有數(shù)據(jù)科學(xué)家,要有DBA,要有業(yè)務(wù)人員,對(duì)他們來說可能人力成本就太大。每個(gè)人那么多細(xì)節(jié)要學(xué)習(xí),對(duì)于公司決策者來說就很不經(jīng)濟(jì)。這兩個(gè)階段的劣勢(shì)就抵消了Idea這個(gè)階段的優(yōu)勢(shì)。

所以我的期望是說會(huì)有一些集成度更好的、對(duì)用戶更友好的產(chǎn)品。不管這些商業(yè)分析的用戶,他想用哪種數(shù)據(jù)模型、想要哪些算法,產(chǎn)品可以更好的提取出來,把這些復(fù)雜度包裝在后面,減輕用戶的心智負(fù)擔(dān),讓用戶更快地去發(fā)現(xiàn)他所需要的商業(yè)價(jià)值,而不是把大量的精力都花在搭建一套甚至幾套很復(fù)雜的圖系統(tǒng)上面——這種事情只有大廠或者大型項(xiàng)目才做得到。技術(shù)目的應(yīng)該是發(fā)現(xiàn)商業(yè)的價(jià)值。而這樣一個(gè)復(fù)雜的流程降低了整個(gè)圖技術(shù)在全市場(chǎng)普及的門檻。

圖數(shù)據(jù)庫(kù)行業(yè)標(biāo)準(zhǔn)化的發(fā)展

然后是關(guān)于標(biāo)準(zhǔn)化部分。標(biāo)準(zhǔn)化其實(shí)和整個(gè)行業(yè)是有些重大影響的,比如ISO-GQL其實(shí)是一個(gè)很好的事,因?yàn)檫@對(duì)于所有的行業(yè)的使用者來說,它可以不再去學(xué)習(xí)每一個(gè)不同的vendor所提供的語(yǔ)言,當(dāng)然是一件非常好的事。當(dāng)然圖領(lǐng)域不只是一個(gè)語(yǔ)言,其實(shí)圖領(lǐng)域有很多的算法,除了大家常見的那幾個(gè)圖算法之外,還有大量的長(zhǎng)尾的圖算法。而那些圖算法,每個(gè)vendor給的接口、給的數(shù)據(jù)導(dǎo)入的方式,它的工作流都是千奇百怪的。對(duì)于整個(gè)領(lǐng)域的開發(fā)者來說,他必須得為這些 vendor 去適配自己的系統(tǒng),這也是一個(gè)很大的成本。還有就是關(guān)于整個(gè)行業(yè)的 Benchmark 的情況,這對(duì)于甲方或者應(yīng)用來說是有意義的。但現(xiàn)在整個(gè)行業(yè)的 Benchmark 還是非常的少,只能體現(xiàn)產(chǎn)品在非常少的幾個(gè)場(chǎng)景下(比如社交、金融個(gè)別場(chǎng)景)的讀或者寫能力是個(gè)什么樣子。這對(duì)于甲方的決策來說還是不夠的,因?yàn)榧追叫枰懈N近于他的業(yè)務(wù)場(chǎng)景的一些 Benchmark 供他參考。否則對(duì)于他來說,每個(gè)項(xiàng)目只能拉著 vendor 來一起設(shè)計(jì) POC,對(duì)整個(gè)采購(gòu)流程也有很大的阻礙,這里面就有很多商業(yè)運(yùn)作的空間。所以我對(duì)于標(biāo)準(zhǔn)化的期望,就是能夠有更多的工作能夠使得整個(gè)行業(yè)的范式發(fā)生一個(gè)遷移。

關(guān)于圖數(shù)據(jù)庫(kù)未來產(chǎn)業(yè)的猜想

最后一個(gè)部分是關(guān)于產(chǎn)業(yè)的,特別是關(guān)于中美市場(chǎng)。大家可以看到中美市場(chǎng)在第一個(gè) Cycle 的時(shí)候,因?yàn)槭芤嬗诶碚摬糠值墓ぷ鳎瑑蓚€(gè)市場(chǎng)對(duì)于技術(shù)的接受程度比較一致。但在第二個(gè) Cycle,就是技術(shù)成熟商業(yè)化階段,中美市場(chǎng)是不太一樣的。因?yàn)閮蓚€(gè)市場(chǎng)的政治沖突,產(chǎn)業(yè)結(jié)構(gòu)、市場(chǎng)化程度等等的差異性,會(huì)導(dǎo)致在第二個(gè) Cycle 的時(shí)候,中美在整個(gè)圖領(lǐng)域會(huì)走上分叉,可能會(huì)走上導(dǎo)致不同的技術(shù)和商業(yè)化的可能性,而且目前看技術(shù)與商業(yè)都分叉的趨勢(shì)還是挺明顯的。

預(yù)祝NebulaGraph在這個(gè)充滿不確定的世界揚(yáng)帆起航

這個(gè)世界充滿不確定,最初開篇說到這里只是對(duì)于圖這個(gè)行業(yè)的一個(gè)小小的觀察和認(rèn)識(shí),所以希望上面這些內(nèi)容能為大家提供更多的確定性,當(dāng)然也有可能為大家提供了更多的不確定性。

[免責(zé)聲明]

原文標(biāo)題: 圖行業(yè)的一些觀察:以圖數(shù)據(jù)庫(kù)為例|NUC 2022

本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評(píng);未經(jīng)許可,禁止轉(zhuǎn)載。

資深作者吳敏
吳敏
0
杭州悅數(shù)科技有限公司
實(shí)力廠商
實(shí)力廠商
優(yōu)質(zhì)服務(wù)
優(yōu)質(zhì)服務(wù)
及時(shí)響應(yīng)
及時(shí)響應(yīng)
立即詢價(jià)
相關(guān)文章
最新文章
查看更多
關(guān)注 36氪企服點(diǎn)評(píng) 公眾號(hào)
打開微信掃一掃
為您推送企服點(diǎn)評(píng)最新內(nèi)容
消息通知
咨詢?nèi)腭v
商務(wù)合作