不要低估算力:電力即生產力,算力是另一種“電力”
1846年1月,料峭寒風中,一行長短不一的電碼,從紐約發出。
130公里開外,費城的交易員收到了這行代表著股價信息的電報,緊接著熟練地按下操作鍵,整個用時不到十秒,相比同行,快了整整半個小時。
時間就是生命,資本市場更是如此,哪怕華爾街巨們需要為此付出10個單詞收費25美分的巨額成本。憑借著時間帶來的巨額差價空間,華爾街巨頭們賺得盆滿缽滿,并自此一舉確立了華爾街作為全球資本市場中心的地位。
不只是資本市場的快速躍進,依托電力基礎,美國的重工業開始替代輕工業,成為時代發展的主旋律,電氣、化學、石油等新興工業部門站在電力的肩膀之上誕生。
一切都在明明白白昭示著一件事——電力,即生產力。
坐在轟轟烈烈的電力工業化車輪之上,五十年后,美國正式取代英國登頂全球第一,世界的格局變化,也自此埋下清晰地注腳。
然而,當兩百年時間過去,新的時代之問產生了,誰將接棒電力,成為新的生產力?
答案已經呼之欲出。
先看數據,根據國際權威機構IDC發布的《2019—2020全球計算力指數評估報告》:全球范圍內,算力指數平均每提高1個點,數字經濟和GDP將分別增長3.3‰和1.8‰。信通院數據則測算,2020年我國算力規模為2億元,直接帶動的經濟總產出為1.7萬億,間接帶動6.3萬億,換算來看,每在算力市場投入1元,將帶動大約4元的經濟產出。
大處著眼,全球算力規模前20的國家中,有17個,都是全球前20的超級經濟體。
中觀來看,依托于算力的大發展,alpha go打敗人類,摘取圍棋的桂冠;一個超級APP中每天播出十億條視頻成為可能;基因測序、天文測算、蛋白質分析進入新的發展階段;半導體、消費電子、互聯網、元宇宙,一個又一個產業憑借著算力進入繁榮井噴期。
數字經濟時代,算力就是生產力,已經毋庸置疑
不過,算力成為生產力的過程,并沒有這么簡單。
事實上,距離華爾街巨頭使用電報傳輸訊息五十年后,電力才真正得以普及。五十年中,隨著交流電技術的成熟,電力傳輸過程中的高損耗問題得以解決,便宜、便捷、隨時可用且好用的電力這才順著交流電網進入尋常百姓家。
算力同理。算力距離生產力還有多遠的根本,在于算力是否像電力一樣,可以做到隨取隨用且好用?
目前來看,答案是否定的。
背后的原因主要有三:
第一層原因來自資源的分布不均。
作為算力的主要承載,數據中心的成本一般可以拆分為兩部分,建設以及運營。建設成本主要是土建、服務器采購等固定成本;一般來說,西部由于人力成本、土地成本的低廉,在建設成本端,較東部地區具備較大優勢。
運營成本,則可以拆分為運維費、管理費用、電費等,運維以及管理費用一般僅占運營成本的兩成;而電費則可以占據運營成本的五成,甚至更多。
但電費同樣存在著嚴重的東西差異。近幾年來,在西部,火電發達的內蒙古,僅需0.5元,風電光伏發達的新疆不到0.4元,水電發達的四川,川藏交界處的電價更是可以低至0.2元。隨著經濟的高速發展,大部分東部地區,工業電價已經在0.8-0.9元每度上下浮動,用電荒與高電價之下,部分東部地區甚至一度把數據中心作為高能耗產業而限制其發展。
也是因此,優質的算力資源呈現出了在西部的區域性集中。
第二層原因則來自供需的不平衡。
與西部具備優質資源形成鮮明對比,全國80%的算力需求都集中在東部地區。這就造成了一個問題:西部空有資源,缺乏需求;而東部需求爆炸,但缺乏優質普惠的算力資源。
為了對接東部的需求與西部的算力,今年2月以來,國家發展改革委、中央網信辦、工業和信息化部、國家能源局聯合印發文件,在全國八大地區建設算力樞紐節點,并規劃了十大國家數據中心集群,促進西部算力支持東部數據運算,東數西算工程正式開啟。
不過,不是數據中心建好,就萬事大吉。海量數據從東部傳送至西部,計算結果再從西部轉回東部,中間首先需要做好應用與算力之間的精準連接;其次,對于分散各處、橫跨中國的零散算力,還需要通過在架構、網絡層面做好統一協調,將整個算力作為一個整體對外提供服務,算網連接算力,解決算力分配不均的必要環節。
第三層原因則在于算力類型的千差萬別。
雖然都是算力,但算力來源上,復雜的任務,需要更高的CPU算力,自動駕駛、數據分析需要更簡單高效的GPU算力;算力應用上,互聯網、制造、科研、農業、天文、金融,不同行業需要不同的算力。互聯網行業需要時常應對雙十一等活動的高并發,制造需要極度的穩定;農業需要更低的成本;金融需要超高的安全性……這中間的根本問題在于,面對不同的算力與需求,要如何同時滿足?
總結來說,只有做好了算力與應用的連接適配,讓算力加速應用的運行,算力才能真正產生價值,成為真正的生產力。
02
方向:算力將去往何方
一個不為人知的故事是,在電力發展的初期階段,如今隨處可見的燈泡其實是一個罕見商品。但很快,聰明的工廠主們發現了一件事,用燈泡照明,那么所有生產力的勞動時間將會被極大提高,夜間勞作,解放生產力,也就成為了可能。
同時,也正是隨著燈泡這一超級應用出現,電力開始在全球范圍內風靡,帶動了產業乃至生產模式的巨大變革。
正如T型車之于石油,電燈之于電力,算力普及成為生產力的另一個前提,是超級應用的出現。
那么對于算力來說,超級應用究竟是什么?業內的一個共識是:科學計算(理化生、氣象天文等)、工程計算(CAD、EDA等)、智能計算(深度學習、自動駕駛等),正是算力成為生產力的超級應用。
比如疫情期間,一個名叫Folding@home的蛋白質動力學模擬項目,積累的算力一度突破1 exaflops(每秒100億億次浮點運算),并成功完成了新冠病毒S蛋白的第一張結構圖。自動駕駛領域,原生的Robotaxi算法需要的算力更是高達數百乃至上千T,對算力的需求和高性能硬件的高成本,已然成為自動駕駛落地階段最大的掣肘。
不難發現,這些超級應用,對算力的需求,并不只是簡單的服務器部署就能解決的,而是需要同時解決高密計算+人工智能+不同領域的專業知識的不同需求。
落到對算力本身的需求上,就需要能夠同時做到巨量計算、多元計算以及專用計算。
所謂巨量計算,主要應對的是現如今機器學習領域最為流行的大模型趨勢。
最典型的應用在于,OpenAI發布的GPT-3模型,其所擁有的參數高達1750億,使用的最大數據集在處理前容量可以達到45TB,訓練過程需要355個GPU年的算力(一塊GPU運行355年的算力)。但很顯然,并不可能真的只用一塊顯卡跑355年,為了OpenAI的訓練,微軟直接構建了一個包含一萬塊GPU的分布式集群,其中單次的訓練費用可以高達460萬美元。
不過,不是所有企業都像微軟財大氣粗,可以一擲千金買下一萬塊顯卡,并且具備長期的巨量運算需求,因此借助于云計算、智算中心,就成了一個明確的行業趨勢。
多元計算也很好理解,在不同業務類型當中,對于算法、模型以及芯片、計算系統的需求其實不盡相同,這就需要算力本身具備多元計算能力。
氣象預測、蛋白質結構模擬領域,需要更高的精度,否則就是一次極端天氣預測的失誤,人類自我認知的偏差。電商領域,典型特征是計算量大、規則多,但計算本身相對簡單,屬于典型的數據密集型計算。Alpha go 、人臉識別等典型的AI訓練,則對精度要求不高,但需要大量的數據投喂,最終做到以最快的速度最低的成本實現規模化部署。金融領域,則不僅需要快速,更需要絕對的安全。
可以說,多元算力支撐,是促進算力在千行百業落地開花的根本保證。
專用計算同理,理論上,一塊CPU可以解決大部分計算問題,但在現實中,針對復雜運算,需要更多的CPU,出于成本、效率等等原因,自動駕駛,我們選擇通用的GPU芯片,谷歌訓練alpha GO時會選擇自己的TPU芯片,不同的計算,需要專門的算力。
就比如,在科學領域,算力經常被用于基因測序以及蛋白質結構模擬,這也是突破人類對自我認知的第一步。一個最基礎的生物學常識是,氨基酸構成多肽,多肽不同的空間結構形成蛋白質;也就是說解密蛋白質,需要對其3D結構進行還原,如果以枚舉法測算蛋白質結構,那么將消耗10的300次冪的搜索空間。過去五十多年,我們僅解析了17%的人類蛋白質。
但是基于專用算力的加持,算力系統的處理器、內存帶寬、網絡、運算方式、系統 I/O、存儲被全面升級,如今AlphaFold2算法已經可以對出98.5%的人類蛋白質結構進行預測,并具備六成的可信度。
也就是說,只有服務好專用的計算需求,才能做好真正的落地,解決不同場景中的實際問題。
當然,巨量、多元、專用,挑出任何一個,看似都不是什么大問題,但對于現實業務來說,這三個要求,往往不是一個三選一,而是我都要。
03
解法:全國一體化算力服務平臺的長路
作為算力服務賽道領軍企業,曙光智算給出的參考答案是,將過去多年建設中留下的寶貴算力資源,用高速網絡統籌連接;通過統一的算網中樞,智能判斷不同任務需要哪些不同的算力,為無論身處任何位置、任何行業的用戶,提供最合適的資源;最后,根據科學計算、工程計算、智能計算等不同的需求,提供多元、巨量且專用的服務。
針對算力分配不均、供需不平衡這兩大門檻。曙光智算推出了“全國一體化算力服務平臺”,最大的特點就是在于具備一體化的架構,可以將不同資源池、不同地域的計算資源匯聚,通過計算服務總線,滿足不同用戶的不同需求。
解決了連接問題后,如何讓更好的服務超級應用,同樣是一門學問。
針對不同需求算力的千差萬別,曙光智算選擇將不同算力所需的不同芯片、服務器、軟件架構全部隱去,以API接口的形式,將其包裝成一個打開即用的產品,讓用戶零門檻的享受算力、算網、算能服務。正如同我們并不需要知道電力如何在電網中流轉,以及中間經歷過多少次變頻變壓,插上插頭就能隨時用電。
當然,做好產品封裝只是第一步,畢竟只有產品不一定能解決所有問題。就像給一個普通人一把廚神專用廚具,也做不出滿漢全席。因此做好算力服務網絡,還需要做好產品以及相關的服務。
“全國一體化算力服務平臺”的思路是,結合上下游一同發力,為客戶提供包含技術培訓、營銷支持等等一系列的解決方向。相當于為客戶用電網通好了電,還同時附送好了插頭,以及使用說明書,提供全流程服務。
但這就夠了嗎?顯然不是。給了用戶說明書,也依然會出現家里突然跳閘、短路,再或者家里有大功率用電需求需要電路改造,這怎么辦?
應對這一層面的需求,曙光智算可以提供標準化運營、隨時響應的一站式服務還有統一的平臺,相當于家里用電出了任何問題,打個電話,供電局就有專門的電工上門服務,提供高質量售后。
基于“全國一體化算力服務平臺”低門檻、產品化的算力服務,越來越多的技術與應用突破逐漸誕生:
“全國一體化算力服務平臺”自規劃到上線以來,短短一年時間里,平臺的作業提交量已經突破3000萬,用戶數量突破10萬個。
除此之外,通過“全國一體化算力服務平臺”提供的對計算、存儲、文件傳輸等資源適配定制以及原生的底層資源、市場化的運營機制、開放的生態體系以及融合多樣的算力供給,菲沙基因糾正了生物學領域一直以來認為黃花菜含有秋水仙堿的誤判;安徽省得以在汛期內也能為用戶精準氣象監測預報;復旦大學類腦科學與技術研究院完成了860億神經元類腦計算,上海交大宇宙學團隊則實現了模擬和再現宇宙……
當然,可能也有人會問,為什么會是曙光智算?
答案也很簡單,因為曙光智算,背后站著的,是來自曙光乃至整個中科院體系這幾十年來對算力的探索,以及對應用落地的經驗。
當越來越多的企業站在全國一體化算力服務平臺的肩膀之上,算力成為生產力的進程,也被按下了加速鍵。
04
尾聲
降低門檻、打造超級應用之后,算力的發展將走向何方?
電力的發展,或許同樣是一個可以借鑒的路徑。
我們會發現,在當年,電力從發現到普及,其實歷經了足足百年的時光。它的發現往往只是千里之行的第一步,無論是技術路線的選擇,超級應用的培育,新舊勢力的博弈,新事物的撥云見月,是一個漫長又曲折的過程。
但在此之后,電燈的出現,帶來了人們的生產力的提升;電話的出現,改變了千年來的通信模式;電機的出現,再次將人類解放,機械成為主要的生產力來源;緊接著,電視、電腦、手機、VR、機器人,越來越多的新技術、新產品在電的基礎之上涌現。
算力也是一樣,即便我們深知目的地所在,但在這個過程中,也會有無數像巨量運算、多元計算等等問題跳出來拷問我們:這條路能做好嗎?
但與此同時,隨著算網的搭建,我們會看到,越來越多的東部算力需求得以緩解;貴州、四川、內蒙古,越來越多的西部地區最優秀的資源,在算力的疏導下得以發揮更高的效用。經濟的發展,新興職業的誕生,都隨著算網的搭建成為現實。
算力的爆發,則帶來了越來越多的行業開始復制互聯網、人工智能的奇跡;微觀到基因的排列組合,蛋白質的空間結構;宏觀到宇宙的組成,天文的預測,那些從前不敢想,做不到的事情,都因為算力而變得可想、可及,變革著我們最日常的生活,與最底層的認知。
回到一開始的問題,算力距離生產力還有多遠?只要一直在路上,路就不遠。
本文來自微信公眾號“遠川科技評論”(ID:kechuangych),作者:劉芮,36氪經授權發布。
