英偉達又「拔」了一下 AI 的上限

極客公園

+ 關(guān)注

2022-09-23 14:23

637次閱讀

英偉達又「拔」了一下 AI 的上限

AI 繼續(xù)加速，解鎖了哪些新場景？

作者 | 宛辰編輯 | 鄭玄

今年的 GTC，老黃又放了一堆「核彈」。

9 月 20 日晚上 11 點，英偉達 CEO 黃仁勛的主題演講為 2022 GTC 揭開序幕。一個半小時的時間里，他介紹了英偉達下一代 RTX GPU 和支持 AI 工作流的新型云服務(wù)，以及各種新系統(tǒng)、芯片和軟件。

對于游戲玩家和創(chuàng)作者而言，他們將獲得首批基于全新 NVIDIA Ada Lovelace 架構(gòu)的 GPU。較上一代旗艦 GPU RTX 3090Ti，此次發(fā)布的 RTX 4090 的性能將提升至前者的四倍。

但在這場演講里，4090 也只是「開胃菜」。在剩下的一個多小時，黃仁勛介紹了英偉達在企業(yè)級市場和汽車市場的進展。

首先是今年 3 月發(fā)布的新一代計算卡「H100」，黃仁勛宣布 Nvidia H100 Tensor Core 現(xiàn)在已經(jīng)全面投產(chǎn)，預(yù)計將在 10 月份上市。為元宇宙開發(fā)搭建的 Omniverse 平臺也迎來全面更新，并將推出 Omniverse Cloud——一款 IaaS 云服務(wù)產(chǎn)品。

而在汽車領(lǐng)域，英偉達公布了新一代自動駕駛芯片 Thor，并放棄了此前發(fā)布的 Atlan。據(jù)英偉達透露，極氪將首發(fā)搭載該芯片，時間為 2025 年，此外如小鵬汽車、輕舟智航等也將使用該芯片。

GeForce RTX 40 系列

首先是最受關(guān)注的 GeForce RTX 40 系列顯卡，會前曾有傳言此次 GTC 40 系列顯卡有可能缺席，結(jié)果并沒有成真。

今年 GTC 英偉達發(fā)布了 40 系列兩款高端顯卡，其中 GeForce RTX 4090 將于 10 月 12 日上市，建議零售價 12999 元起；GeForce RTX 4080 將于 11 月推出，采用 12GB 和 16GB 顯存兩種配置版本，建議零售價分別為 7199 元和 9499 元起。

上一代 RTX 3090 和 RTX 3080 的首發(fā)價分別為 11999 元和 5499 元，40 系列顯卡的價格提升了不少，但相比上一代產(chǎn)品，40 系列的性能也有了顯著提升。根據(jù)黃仁勛介紹，GeForce RTX 4090 的性能將提升至上一代 RTX 3090 Ti 的 4 倍，GeForce RTX 4080 也比上一代產(chǎn)品在性能和功耗上有很大進步。

「和加速計算一樣，計算機圖形也是一項全棧挑戰(zhàn)。」黃仁勛解釋道，「若要實現(xiàn)突破，需要在架構(gòu)、設(shè)計和算法方面進行創(chuàng)新。」

而在上述幾個維度，尤其是架構(gòu)和算法上，40 系列新顯卡都有跨越式的提升。

在架構(gòu)方面，40 系列顯卡建立在全新的第三代 RTX 架構(gòu)——即 Ada Lovelace（Ada 架構(gòu)）。在優(yōu)化的 4N 工藝下，Ada GPU 可以集成 760 億個晶體管和超過 18000 個 CUDA 核心，比上一代 Ampere GPU 多了 70%。

新架構(gòu)下，所有三類處理器均有改進，包括：SM 多單元流處理器、RT Core 和 Tensor Core。值得注意的是，單個 Ada GPU 即可支持 RacerX（基于物理定律的仿真）的運行。

在算法上，40 系列顯卡在基于深度學(xué)習的神經(jīng)網(wǎng)絡(luò)渲染上取得了突破——引入了第三代 DLSS 技術(shù)。

光線追蹤所需的計算量近乎瘋狂，CGI 電影的每一幀畫面渲染都需要數(shù)小時。英偉達 RTX 打開了實時光線追蹤世界的大門，并且，通過引入基于深度學(xué)習的超分辨率技術(shù)，進一步提高了游戲幀率。

DLSS 3 通過將新幀和上一幀進行比較來了解場的變化，從而利用 AI 生成全新幀。與傳統(tǒng)渲染相比，它能將游戲性能提高多達 4 倍。在這項技術(shù)的加持下，無論是對 GPU 性能要求較高的游戲還是受到 CPU 限制的游戲，都將從中受益。

老黃總結(jié)道：相較于 4 年前首次引入實時光線追蹤技術(shù)，今天借助 AI，英偉達在 4 年內(nèi)將光追的性能升了 16 倍；與此同時，GPU 中負責此類計算的晶體管數(shù)量并沒有以同比增加，一些像素通過計算得出，而大多數(shù)像素則通過 AI 預(yù)測得出。

另外值得注意的是，此次英偉達只發(fā)布了兩款 40 系列的高端顯卡，這與游戲顯卡市場需求疲軟、英偉達急于去庫存有一定關(guān)系。

黃仁勛在會后接受分析師采訪時表示：終端市場目前需求疲軟，英偉達減少了供應(yīng)，來幫助下游消化 3080、3080 積壓的庫存，并預(yù)計用兩個季度完成。對于 Ada 架構(gòu)的新顯卡，英偉達會在這個季度開始進行小規(guī)模生產(chǎn)，并在明年進行更多的公布。

此外，對于市場環(huán)境是否會影響 4080 和 4090 顯卡的銷售，黃仁勛認為，4080、4090 主要針對高端游戲玩家，受到的市場影響較小。

簡單來說，4080 和 4090 兩款高端旗艦顯卡相較上一代性能有明顯提升，有換代需求的高端玩家依然會正常購買。但對于 4070、4060 這些在性能上與 3080、3080 這些上一代旗艦性能相近的產(chǎn)品，為了避免影響下游去庫存，英偉達會在更晚的時間點發(fā)布。

Omniverse 推出云服務(wù)

互聯(lián)網(wǎng)的下一次演化方向被視作元宇宙，而英偉達對于元宇宙的理解是「數(shù)字孿生」。英偉達于 2019 年正式推出 Omniverse，一個用來構(gòu)建和運行元宇宙應(yīng)用的平臺。

簡單來說，Omniverse 是一個實時的大型 3D 數(shù)據(jù)庫，一個可以共享的 3D 世界，一個基于 USD 構(gòu)建的網(wǎng)絡(luò)；同時，它也是一個計算平臺，使用者可以編寫在 Omniverse 上運行的應(yīng)用，這些應(yīng)用如同進入 Omniverse 虛擬世界的門戶。

此外，英偉達也編寫了一些 Omniverse 應(yīng)用，例如用于協(xié)作的 Create 和 View，用于合成數(shù)據(jù)生成的 Replicator，以及用于數(shù)字孿生模擬的 Isaac Sim 和 Drive Sim。

作為一個新的計算平臺，Omniverse 由三部分構(gòu)成：RTX 計算機（供創(chuàng)作者、設(shè)計師和工程師使用）、OVX 服務(wù)器（用來托管與 Nucleus 數(shù)據(jù)庫的連接并運行虛擬世界模擬）以及第三部分：NVIDIA GDN（進入 Omniverse 的門戶）。

會上，黃仁勛介紹了第二代 OVX 系統(tǒng)，后者將由 Ada Lovelace L40 數(shù)據(jù)中心 GPU 提供支持，該 GPU 現(xiàn)已全面投產(chǎn)。

此外，英偉達還宣布推出 Omniverse Cloud。這是一款 Iaas 產(chǎn)品，可連接在云上、本地或單個設(shè)備上運行的 Omniverse 應(yīng)用。

黃仁勛介紹：新的 Omniverse 容器現(xiàn)已可以部署到云端，該容器包括用于合成數(shù)據(jù)生成的 Replicator、用于擴展渲染農(nóng)場的 Farm 以及用于構(gòu)建和訓(xùn)練 AI 機器人的 Isaac Sim。

Omniverse 上云一方面意味著將進一步方便協(xié)作，提升效率；另一方面，也意味著英偉達數(shù)字孿生業(yè)務(wù)將覆蓋更大的應(yīng)用場景和客戶。

黃仁勛表達了自己對元宇宙的看法：未來，所有的產(chǎn)品都將具有數(shù)字孿生。制造商利用數(shù)字孿生模擬產(chǎn)品在物理世界中的作用和性能。如果不對軟件的數(shù)字孿生版本進行測試，則無法大規(guī)模部署該軟件所運營的的物理產(chǎn)品。

英偉達又「拔」了一下 AI 的上限

黃仁勛列舉了很多客戶案例來解釋不同領(lǐng)域的公司如何利用 Omniverse，比如為工廠、物流倉庫、自動化生產(chǎn)線和工業(yè)廠房創(chuàng)建數(shù)字孿生；如何利用 Omniverse 實現(xiàn)團隊互聯(lián)，以全保真度可視化他們的數(shù)據(jù)并生成合成數(shù)據(jù)，從而訓(xùn)練 AI 模型，模擬數(shù)字孿生。

自動駕駛：放棄

Atlan，擁抱 Thor

最后，多少有點出乎意料，英偉達公布了新一代自動駕駛平臺 Thor。

英偉達又「拔」了一下 AI 的上限

目前，想要實現(xiàn)汽車中的主動安全、停車、駕駛員監(jiān)測、攝像頭后視鏡、集群和車載信息、娛樂系統(tǒng)等功能通常需要不同的計算機提供支持。而未來，它們將由在中央計算機上運行的軟件統(tǒng)一提供支持，并隨著時間的推移不斷改進。

去年，英偉達推出了 Atlan，一款 1000 TOPS 的 SoC。雖然這款產(chǎn)品還沒有投產(chǎn)，但是黃仁勛宣布 Atlan 不再是第一了，它將被 Thor 取代。

新推出的 DRIVE Thor 平臺，集成了基于 Hopper 的 Transformer Engine、基于 Ada 的 GPU 和基于 Grace 的 CPU。

黃仁勛表示，Hopper 的 Transformer 引擎以及 Vision Transformer 的快速變革，它們都至關(guān)重要，必須納入到下一代的機器人處理器，而 Ada 中多實例 GPU 的發(fā)明將有助于車載計算資源的集中化可將成本降低數(shù)百美元，Grace 的 CPU 則正好擁有非常出色的單線程性能。

基于這些基礎(chǔ)，Thor 的吞吐量是上一代 Atlan 的兩倍，交付的性能也是 Atlan 的兩倍以上。并且，Thor 能夠與目前被用于量產(chǎn)汽車、可提供每秒 254 萬億次浮點運算性能的 DRIVE Orin 無縫銜接。

使用場景上，Thor 處理器可以應(yīng)用在機器人、醫(yī)療儀器、工業(yè)自動化和邊緣 AI 系統(tǒng)等。

對于英偉達取消 Atlan 的原因，黃仁勛在會后接受分析師采訪時表示，Atlan 的產(chǎn)品包括 GPU、CPU 和 Tensor Core 三個關(guān)鍵的架構(gòu)。這三個架構(gòu)，在過去兩年都發(fā)生了巨大的進步。每過兩年。機器人系統(tǒng)的研發(fā)都會迎來重大更新，這是他們做出取消 Atlan 直接做 Thor 的原因。

此外，黃仁勛還進一步透露，除了會上公布的極氪等中國車廠，到 2025 年，奔馳、捷豹路虎等車企的車隊，都會由英偉達提供全棧式的解決方案。公司預(yù)計未來在汽車業(yè)務(wù)領(lǐng)域中的商業(yè)化速度以及競爭將會加劇。目前英偉達大概有 110 億美金的在手訂單和汽車業(yè)務(wù)相關(guān)。