国产精一区二区_午夜视频99_免费白白视频_中文字幕一区免费

進入深水區,AI 基礎設施的角色是什么?

極客公園
+ 關注
2022-08-03 11:02
480次閱讀

進入深水區,AI 基礎設施的角色是什么?

突破性能紅線之后,需要突破成本紅線

作者 | 凌梓郡編輯 | 鄭玄

經過十年,人們對 AI 的認識逐漸清晰。正如前不久谷歌的工作人員聲稱 AI 聊天程序 LaMDA 擁有了意識,很快就被認為并不成立。AI 的存在,并非為了是挑戰人類,而是為了提供工具、優化流程、提供效率。

就在上周,DeepMind 發布了最新的蛋白質結構數據庫:超過 2 億個蛋白質結構,這幾乎涵蓋了科學界所有已知的有編目的蛋白質。AlphaFold 是 AI 為生物學研究提供的強大工具。有了 AI 的助力,生物學家能夠花更多精力研究蛋白質的功能,而非測量結構。

技術發展是一個疊加的進程。AI 也需要這樣,進入具體領域,發生對話,實現其技術價值。以怎樣的形式讓交流發生,也是經歷了上一階段的 AI 創業公司需要思考的議題。而對于想應用新技術的公司,又面對需要跨越的學習門檻。

對于單個企業而言,搭建硬件、調試算法從頭做起不切實際。如何將需求落實為技術方案,再運用技術方案實現管理?將這個問題給到 AI 技術提供方,思考又會拆分為許多層,場景匹配算法、算法接入框架、芯片支持算力。

商湯正在探索的解法是「AI 基礎設施」,將不同層的技術層集中建設、按需要調配,降低使用門檻和成本。「需要推動整個的生產方式,從手工作坊向工業化量產去邁進。」商湯聯合創始人與大裝置首席科學家林達華說。「AI 大裝置」,也是商湯對軟硬一體大型通用型基礎設施的稱呼。

2022 年初,坐落在上海的「商湯科技人工智能中心」啟動運營。第二個城市級 AI 基礎設施,商湯來到了山東。七月底,「2022 中國算力大會」在山東省濟南市召開,于「中國北方 AI 算力創新中心」正式啟動。算力大會上,商湯與山東省淄博市政府一起討論如何用「AI 基礎設施」更好地助力城市的數字化升級。

 

01

「數字化」的下一步,

與 AI 的下一步

 

當這個「數字化」的概念展開,是 AI 進入具體的產業場景,看到的復雜需求。

在改革開放之后,中國用極短的時間完成了城市化。大刀闊斧的歷史進程告一段落,經濟模式升級的需求持續存在,必然需要尋找新的方式。山東也在最近這幾年發力,去年的信息技術產業營收突破 1.2 萬億元,數字經濟規模總量排到了全國第三。在數字經濟建設上,明確了十四五期間數據中心建設規劃,加快提升數據與算力基礎設施服務能力。

當一個省要實現數字經濟的發展突破,AI 恰是能夠為各行各業提供「工具」與「引擎」的技術。從這個角度而言,商湯進入山東,也是技術發展與城市化進程的交匯。

商湯在去年底上市,成為 AI 第一股。轉年初 1 月,位于上海臨港的人工智能計算中心(AIDC)啟動運營。AIDC 集合了 2 萬多塊 GPU,支持每秒 3.74 百億億次的浮點算力,能夠支持數 10000 億參數模型完整訓練。是目前亞洲最大的人工智能計算中心之一。為什么作為一家軟件為核心能力的公司,會建立這樣一個大規模的基礎設施?這便要從人工智能目前的發展階段去理解。

三次人工智能浪潮以來,最近十年是 AI 第一次走出實驗室,進入大千世界的各種場景。現實世界總是充滿不曾被注意的細節。商湯 AI 大裝置事業群總裁楊帆形容。「隨著人工發展走入深水區,將面臨一個很大的挑戰:今天的 AI 解決一個問題,自身所花費的成本和代價,可能比帶來的好處還要大。」而商業化,則必須要降低成本。AI 發展至今,從硬件到軟件、框架、模型,也有一套隨之發展的技術體系,軟件能力也依靠整個技術生態而實現。

進入深水區,AI 基礎設施的角色是什么?

位于上海臨港的商湯科技人工智能計算中心

商湯建立大型 AI 基礎設施,便是將發展至今技術體系中不同的資源集中在一起,在面對具體的需求時,不必從頭造輪子,快速調取合適的資源,簡單調整后適配。「我們建設了從數據準備、模型訓練到模型部署全鏈條的技術平臺。」林達華表示。

以數據標注為例,高質量標注的數據,能夠成為生產資料,訓練出優異的模型。在人工智能產業初期,數據標注更依靠人工,隨著產業發展,高成本、低效率的人工必然需要減少。目前,在商湯自建的數據平臺上,已經集成上百個提供自動標注方案的 AI 模型。比起一般的數據標注服務,效率提升超過 60%。

02

為算法應用降低成本

 

當人工智能進入到行業,會發現生產鏈條非常長,并且場景多樣化。林達華形容,「我們遇到很多長尾場景,響應每個具體需求的時候,成本和代價都是非常高的。因此要讓人工智能成為未來整個國民經濟發展的根本。需要突破新的紅線,就是成本紅線。」

想更加靈活、低成本應對不同場景需求,商湯選擇將生產過程劃分為兩個階段。在第一個階段,依靠大規模算力,匯聚來自不同場景不同任務的數據,訓練出一個基礎模型。在這個基礎模型之上,再去回應更細分的具體需求。于是在第二階段,只需要少量的數據、輕量的計算,就能夠應對需求。這使得處理單個案例的成本下降。

進入深水區,AI 基礎設施的角色是什么?

沖壓生產線在線自動檢測

在青島,商湯和一汽解放一起開發了「5G+AI」的沖壓件表面質量在線檢測。在沖壓自動生產線的最后一環,用相機拍照,對沖壓件板材的質量和尺寸進行識別和檢測。沖壓工藝是汽車制造環節之一,是人員密集型產線。以前依靠人工檢測,缺陷檢出率較低。使用 AI 檢測之后,大大提升了檢測效率。

這個功能依靠商湯 AIDC 提供算力支持,利用商湯深泉算法訓練平臺。深泉算法訓練平臺是專為工業制造領域的打造智能模型生產平臺,承接來自各種場景的業務需求。深泉平臺能夠提供模型的自動訓練,還能模型進行評估、迭代,從而篩選出最佳模型自動完成部署,供用戶進行調用。它存在的目的,就是幫助工業制造行業的客戶降低研發門檻。

「一個成功的人工智能基礎設施,除了基礎的一些存儲算力外,額外有兩個點:低成本門檻、低技術門檻,換句話說就是用的起和得會用。」商湯科技副總經理楊松在圓桌討論時說。

在工業制造領域,依托算法訓練平臺,商湯在青島也與其它工廠一起開發了多種應用。在海爾工廠中,商湯通過應用 5G+AI+MEC 識別技術,對進入工廠的車輛、設備等進行智能識別與管理,防止車輛進入生產重地等非行駛區域;在生產線上,商湯也與海爾構建了標準生產管理模型,對生產流程進行檢測和提示,最終使操作和檢驗達到 100% 一致性。

降低 AI 技術使用門檻,也不是僅靠 AI 公司就能夠實現。對于學習成本較高的企業而言,需要有契機與新技術發生交流。AI 真正在場景里落地,是逐漸發生的過程。商湯表示:我們希望在產業里面做平臺的整合,跟大家一起去努力讓訓練平臺、推理平臺的集成化更高,把一些底層技術封裝起來。

 

03

生態的兩端:

從設施到人才

 

在算力大會上,由淄博市政府牽頭的「中國北方 AI 算力創新中心」正式啟動。這是一個城市級的人工智能底座,對于淄博這座城市而言,是第一個數字經濟的基礎設施。淄博也是全國首批產業轉型升級示范區之一。

如果簡單比喻:算力是生產力,算法是生產關系,數據是生產資料。若從產業視角來看,算力則屬于高耗能產業。因此選擇集約化的方式建造算力中心,能夠有效利用資源。

林達華表示:建設面向人工智能場景的高性能的調度系統,帶來了更低的性能損耗,更高的資源利用。集中調度系統,就需要算力平臺作為支撐。AI 算力創新中心,也將扮演支撐者的角色。在城市數字化的過程中,淄博意識到「急需一個統一的 AI 能力中心平臺。」數字化轉型中,往往第一步是傳感器等基礎設施搭建。這提供了基礎的數據。下一步,需要有效的數據分析和處理,才是智能化的開始。

進入深水區,AI 基礎設施的角色是什么?

AI 算力創新中心將解決數據的打通和處理問題。林達華舉例說:商湯的技術團隊建設起來了專用面向人工智能的存儲系統,可以對數以億計甚至百億級的小文件進行一個隨機的訪問,例如 5 秒鐘就可以讀取完成 3000 多萬輛機動車輛的信息。

在一個城市建立AI基礎設施,短期來看,能夠解決種種應用需求;長期而言,則是 AI 持續與當地產業交流,這也為產業人才培養提供了重要環境目前,商湯與青島職業技術學院共建了青島市人工智能產教科創實訓基地。

作為和 AI 技術一路成長的企業,商湯也愿意與同行者一起做長期的事情。楊松在圓桌討論的尾聲說,「只有 AI 人才數量提升,每個企業才會對自身的數字化轉型和人工智能建設,有更好的認知;這樣才會有一個總體的解決方案,去看一個具體的行業怎樣去接入到人工智能企業去。」

*頭圖來源:Pexels

本文來自微信公眾號“極客公園”(ID:geekpark),作者:凌梓郡,36氪經授權發布。

0
消息通知
咨詢入駐
商務合作