英偉達又「拔」了一下 AI 的上限
AI 繼續加速,解鎖了哪些新場景?
作者 | 宛辰編輯 | 鄭玄
今年的 GTC,老黃又放了一堆「核彈」。
9 月 20 日晚上 11 點,英偉達 CEO 黃仁勛的主題演講為 2022 GTC 揭開序幕。一個半小時的時間里,他介紹了英偉達下一代 RTX GPU 和支持 AI 工作流的新型云服務,以及各種新系統、芯片和軟件。
對于游戲玩家和創作者而言,他們將獲得首批基于全新 NVIDIA Ada Lovelace 架構的 GPU。較上一代旗艦 GPU RTX 3090Ti,此次發布的 RTX 4090 的性能將提升至前者的四倍。
但在這場演講里,4090 也只是「開胃菜」。在剩下的一個多小時,黃仁勛介紹了英偉達在企業級市場和汽車市場的進展。
首先是今年 3 月發布的新一代計算卡「H100」,黃仁勛宣布 Nvidia H100 Tensor Core 現在已經全面投產,預計將在 10 月份上市。為元宇宙開發搭建的 Omniverse 平臺也迎來全面更新,并將推出 Omniverse Cloud——一款 IaaS 云服務產品。
而在汽車領域,英偉達公布了新一代自動駕駛芯片 Thor,并放棄了此前發布的 Atlan。據英偉達透露,極氪將首發搭載該芯片,時間為 2025 年,此外如小鵬汽車、輕舟智航等也將使用該芯片。
01
GeForce RTX 40 系列
首先是最受關注的 GeForce RTX 40 系列顯卡,會前曾有傳言此次 GTC 40 系列顯卡有可能缺席,結果并沒有成真。
今年 GTC 英偉達發布了 40 系列兩款高端顯卡,其中 GeForce RTX 4090 將于 10 月 12 日上市,建議零售價 12999 元起;GeForce RTX 4080 將于 11 月推出,采用 12GB 和 16GB 顯存兩種配置版本,建議零售價分別為 7199 元和 9499 元起。
上一代 RTX 3090 和 RTX 3080 的首發價分別為 11999 元和 5499 元,40 系列顯卡的價格提升了不少,但相比上一代產品,40 系列的性能也有了顯著提升。根據黃仁勛介紹,GeForce RTX 4090 的性能將提升至上一代 RTX 3090 Ti 的 4 倍,GeForce RTX 4080 也比上一代產品在性能和功耗上有很大進步。
「和加速計算一樣,計算機圖形也是一項全棧挑戰。」黃仁勛解釋道,「若要實現突破,需要在架構、設計和算法方面進行創新。」
而在上述幾個維度,尤其是架構和算法上,40 系列新顯卡都有跨越式的提升。
在架構方面,40 系列顯卡建立在全新的第三代 RTX 架構——即 Ada Lovelace(Ada 架構)。在優化的 4N 工藝下,Ada GPU 可以集成 760 億個晶體管和超過 18000 個 CUDA 核心,比上一代 Ampere GPU 多了 70%。
新架構下,所有三類處理器均有改進,包括:SM 多單元流處理器、RT Core 和 Tensor Core。值得注意的是,單個 Ada GPU 即可支持 RacerX(基于物理定律的仿真)的運行。
在算法上,40 系列顯卡在基于深度學習的神經網絡渲染上取得了突破——引入了第三代 DLSS 技術。
光線追蹤所需的計算量近乎瘋狂,CGI 電影的每一幀畫面渲染都需要數小時。英偉達 RTX 打開了實時光線追蹤世界的大門,并且,通過引入基于深度學習的超分辨率技術,進一步提高了游戲幀率。
DLSS 3 通過將新幀和上一幀進行比較來了解場的變化,從而利用 AI 生成全新幀。與傳統渲染相比,它能將游戲性能提高多達 4 倍。在這項技術的加持下,無論是對 GPU 性能要求較高的游戲還是受到 CPU 限制的游戲,都將從中受益。
老黃總結道:相較于 4 年前首次引入實時光線追蹤技術,今天借助 AI,英偉達在 4 年內將光追的性能升了 16 倍;與此同時,GPU 中負責此類計算的晶體管數量并沒有以同比增加,一些像素通過計算得出,而大多數像素則通過 AI 預測得出。
另外值得注意的是,此次英偉達只發布了兩款 40 系列的高端顯卡,這與游戲顯卡市場需求疲軟、英偉達急于去庫存有一定關系。
黃仁勛在會后接受分析師采訪時表示:終端市場目前需求疲軟,英偉達減少了供應,來幫助下游消化 3080、3080 積壓的庫存,并預計用兩個季度完成。對于 Ada 架構的新顯卡,英偉達會在這個季度開始進行小規模生產,并在明年進行更多的公布。
此外,對于市場環境是否會影響 4080 和 4090 顯卡的銷售,黃仁勛認為,4080、4090 主要針對高端游戲玩家,受到的市場影響較小。
簡單來說,4080 和 4090 兩款高端旗艦顯卡相較上一代性能有明顯提升,有換代需求的高端玩家依然會正常購買。但對于 4070、4060 這些在性能上與 3080、3080 這些上一代旗艦性能相近的產品,為了避免影響下游去庫存,英偉達會在更晚的時間點發布。
02
Omniverse 推出云服務
互聯網的下一次演化方向被視作元宇宙,而英偉達對于元宇宙的理解是「數字孿生」。英偉達于 2019 年正式推出 Omniverse,一個用來構建和運行元宇宙應用的平臺。
簡單來說,Omniverse 是一個實時的大型 3D 數據庫,一個可以共享的 3D 世界,一個基于 USD 構建的網絡;同時,它也是一個計算平臺,使用者可以編寫在 Omniverse 上運行的應用,這些應用如同進入 Omniverse 虛擬世界的門戶。
此外,英偉達也編寫了一些 Omniverse 應用,例如用于協作的 Create 和 View,用于合成數據生成的 Replicator,以及用于數字孿生模擬的 Isaac Sim 和 Drive Sim。
作為一個新的計算平臺,Omniverse 由三部分構成:RTX 計算機(供創作者、設計師和工程師使用)、OVX 服務器(用來托管與 Nucleus 數據庫的連接并運行虛擬世界模擬)以及第三部分:NVIDIA GDN(進入 Omniverse 的門戶)。
會上,黃仁勛介紹了第二代 OVX 系統,后者將由 Ada Lovelace L40 數據中心 GPU 提供支持,該 GPU 現已全面投產。
此外,英偉達還宣布推出 Omniverse Cloud。這是一款 Iaas 產品,可連接在云上、本地或單個設備上運行的 Omniverse 應用。
黃仁勛介紹:新的 Omniverse 容器現已可以部署到云端,該容器包括用于合成數據生成的 Replicator、用于擴展渲染農場的 Farm 以及用于構建和訓練 AI 機器人的 Isaac Sim。
Omniverse 上云一方面意味著將進一步方便協作,提升效率;另一方面,也意味著英偉達數字孿生業務將覆蓋更大的應用場景和客戶。
黃仁勛表達了自己對元宇宙的看法:未來,所有的產品都將具有數字孿生。制造商利用數字孿生模擬產品在物理世界中的作用和性能。如果不對軟件的數字孿生版本進行測試,則無法大規模部署該軟件所運營的的物理產品。
黃仁勛列舉了很多客戶案例來解釋不同領域的公司如何利用 Omniverse,比如為工廠、物流倉庫、自動化生產線和工業廠房創建數字孿生;如何利用 Omniverse 實現團隊互聯,以全保真度可視化他們的數據并生成合成數據,從而訓練 AI 模型,模擬數字孿生。
03
自動駕駛:放棄
Atlan,擁抱 Thor
最后,多少有點出乎意料,英偉達公布了新一代自動駕駛平臺 Thor。
目前,想要實現汽車中的主動安全、停車、駕駛員監測、攝像頭后視鏡、集群和車載信息、娛樂系統等功能通常需要不同的計算機提供支持。而未來,它們將由在中央計算機上運行的軟件統一提供支持,并隨著時間的推移不斷改進。
去年,英偉達推出了 Atlan,一款 1000 TOPS 的 SoC。雖然這款產品還沒有投產,但是黃仁勛宣布 Atlan 不再是第一了,它將被 Thor 取代。
新推出的 DRIVE Thor 平臺,集成了基于 Hopper 的 Transformer Engine、基于 Ada 的 GPU 和基于 Grace 的 CPU。
黃仁勛表示,Hopper 的 Transformer 引擎以及 Vision Transformer 的快速變革,它們都至關重要,必須納入到下一代的機器人處理器,而 Ada 中多實例 GPU 的發明將有助于車載計算資源的集中化可將成本降低數百美元,Grace 的 CPU 則正好擁有非常出色的單線程性能。
基于這些基礎,Thor 的吞吐量是上一代 Atlan 的兩倍,交付的性能也是 Atlan 的兩倍以上。并且,Thor 能夠與目前被用于量產汽車、可提供每秒 254 萬億次浮點運算性能的 DRIVE Orin 無縫銜接。
使用場景上,Thor 處理器可以應用在機器人、醫療儀器、工業自動化和邊緣 AI 系統等。
對于英偉達取消 Atlan 的原因,黃仁勛在會后接受分析師采訪時表示,Atlan 的產品包括 GPU、CPU 和 Tensor Core 三個關鍵的架構。這三個架構,在過去兩年都發生了巨大的進步。每過兩年。機器人系統的研發都會迎來重大更新,這是他們做出取消 Atlan 直接做 Thor 的原因。
此外,黃仁勛還進一步透露,除了會上公布的極氪等中國車廠,到 2025 年,奔馳、捷豹路虎等車企的車隊,都會由英偉達提供全棧式的解決方案。公司預計未來在汽車業務領域中的商業化速度以及競爭將會加劇。目前英偉達大概有 110 億美金的在手訂單和汽車業務相關。
本文來自微信公眾號“極客公園”(ID:geekpark),作者:宛辰,36氪經授權發布。