大廠大模型,強在哪?
今年以來,中國科技公司掀起“百模大戰”,大廠、創業公司都發布了自己的AI大模型。
大模型越來越多,有閉源有開源,有通用也有垂直;企業做大模型的策略也不盡相同,有的堅持從底座做起,有的在開源架構之上抄近道。
不過,雖然路徑有差異,但有一點逐漸成為行業共識——大模型要落地,得從產業開始。B端的使用效果,成為評價一個大模型靠不靠譜的重要指標。
做出一個大模型不難,難的是讓大模型具備產業價值,在應用的時候穩定、安全、易用。
對于To B企業而言,面對如此眾多的大模型產品,該如何選擇?
短短半年時間,大模型創業就經歷了共識之變。
年初,很多人認為,通用大模型是未來。大家看到GPT3.5大模型強大的泛化能力,感到非常興奮,認為大模型似乎可以解決一切問題。
這里簡單科普一下,大模型分為兩類,一類是通用大模型,可以聊天、問答、通用數理計算等,另一類是垂直大模型或行業大模型,面向產業,突出應用,強調降本增效的作用。
有創業公司基于開源的大模型,快速做出了一些有意思的產品,AI繪畫、AI寫作、AI數字人等火爆。
然而沒過多久大家發現,做出類似產品的門檻不高。受制于算力的稀缺性,很難將大模型包裝成類似微信這種大范圍使用的付費C端產品。而大模型訓練的成本很高,部分參數量很大的大模型,訓練一次動輒耗資數千萬。
盲目燒錢不可持續,如何讓大模型在產業里發揮作用,產生價值,成為很多大廠考慮的問題。
百度就發現,文心一言發布后,一開始來交流的企業都是CEO級別的人出面,后來大多是技術負責人或業務負責人。字節跳動發現,來找火山引擎的企業,四五月份都是模型廠商,需求是訓練模型,現在是一些行業客戶,希望在營銷、客服等場景落地。
從玩具到工具,落地才是王道。所以我們看到,近期國內科技公司新發布的大模型,大多都面向垂類產業落地。而垂直行業里的企業們,都有很強的降本增效的需求。
這導致一個結果,全球的基礎大模型,現階段都主要面向To B行業市場。
To B客戶在選擇大模型產品時,應該重點考察哪些方面?
首先,有沒有“云”很重要。
這波AI 2.0浪潮,很多能力都是建立在云平臺之上。通過云平臺輸出模型能力,支撐更多應用生長,是一套比較高級的打法。
大模型離不開云廠商。國內現在跑的最快的大模型公司,如百度、阿里,都有自己的云業務。而在它們公司內部,云部門也是沖在最前面。
這是大廠跟創業公司非常大的一個區別,即便是OpenAI,也要借助微軟云平臺Azure。而微軟也借此實現了對OpenAI更強的控制,成為其獨家云廠商。
一些在算法上實力不弱的創業公司,也許能在很短時間內,基于開源代碼開發出自己的大模型,但它們沒有自己的云底座,必須得找云廠商合作,后期在系統部署、數據歸屬、利益分成方面,難免存在隱患。
其次,要看有沒有“生態”。
大模型創業的生態分為四層——芯片層、框架層、模型層、應用層。其中芯片層+框架層是基礎設施,企業的進入門檻最高;模型層對算力、算法、數據、人才的要求非常高;應用層是基于前兩類大模型,調用API開發應用。
所有的玩家都要在這四大層級里站位,縱向覆蓋的層級越多,競爭壁壘越深厚。
中國的科技公司在布局時,尤其是BAT這樣的超級巨頭,往往會交叉覆蓋四大層級。基礎打法是先發布通用大模型或者行業大模型底座,其他公司再基于這些基礎模型,結合自身擁有的行業數據,微調出自己的大模型應用。
最后,服務體驗也不能忽視。
企業客戶在選擇大模型時,不能只看中技術實力,是否懂行,能否保證交付,運維有沒有長期保障,同等重要。
以上這三個方面,將決定哪些公司的大模型產品,更能獲得客戶青睞。
綜合來看,大廠的優勢明顯。
業界普遍認為,百度、阿里、華為是綜合實力排名靠前的玩家。
就像當年的云計算市場一樣,底層算力和平臺能力可以構建壁壘,市場需要算力強悍、模型全面的服務商。那些在算力、平臺、模型、應用方面都有布局的大廠,對企業客戶具備更強吸引力。
百度、華為,除了自研大模型產品,還完成了從芯片到應用的布局。百度是“昆侖芯+飛槳平臺+文心大模型”,華為是“昇騰芯片+MindSpore框架+盤古大模型”,這是其他公司在短期內很難追上的優勢。
也是基于這些優勢,大廠一方面在技術上做到了領先,另一方面在服務客戶上更接地氣。
比如百度,百度是國內第一個推出類ChatGPT產品,開放內測,硬剛ChatGPT的公司。在SuperCLUE中文大模型7月最新榜單中,百度的大語言模型產品文心一言,以62分的總成績超過了GPT-3.5-turbo和ChatGLM-130B。IDC最新發布的《AI大模型技術能力評估報告,2023》中,百度文心大模型3.5拿下12項指標中的7個滿分,綜合評分第一。
現在,國內的大模型廠商,都在積極拓展ToB業務。百度的文心千帆,是全球首個一站式企業級大模型平臺,可以為企業提供從數據處理、模型訓練、模型部署到模型運維等全流程的大模型服務。
因為有完善的工具鏈,配套更豐富,文心千帆在為客戶提供服務時,能更全面、更易用、更安全。這大大降低了企業開發大模型的門檻,基本接近“開箱即用”的效果。
拋開這些硬實力,在軟實力方面,大廠的優勢也很明顯。無論是資金儲備、人才厚度,還是產業洞察、數據積累,都非創業公司所能比。大廠過去十幾年的經驗,在持續構建競爭壁壘。
尤其是在垂直行業資源方面,大廠布局很深。百度一口氣推出十多個行業大模型,華為推出礦山大模型、實時預測全球海浪的大模型,以及京東面向零售、金融、城市、健康和物流領域提供行業解決方案,都體現出大廠已經在“用大模型賦能千行百業”。
這場AI大模型的長跑,不同背景的玩家,并不是站在同一個起跑線上。
具備資金儲備、生態能力、產業洞察、戰略意志的實力玩家,最有可能率先到達終點。
本文來自「定焦One」,36氪經授權發布。
