NVIDIA於GTC 2024春季場發表Blackwell GPU與NVLink交換器晶片，單顆GPU效能高達20PFLOPS

NVIDIA創辦人暨執行長黃仁勳於2024年3月18日的GTC主題演講發表了最新的Blackwell GPU，單顆B200 GPU就能帶來高達20PFLOPS的FP4資料類型運算效能。Image may be NSFW.
Clik here to view. 5c4cd94197161a659bee200f14f4ef55

NVIDIA創辦人暨執行長黃仁勳於2024年3月18日的GTC主題演講發表了最新的Blackwell GPU，單顆B200 GPU就能帶來高達20PFLOPS的FP4資料類型運算效能，還可搭配NVLink交換器晶片組織由36顆CPU、72顆GPU構成的機櫃。

新世代AI運算晶片降臨

B200 GPU（繪圖處理器）採用Blackwell架構，晶片由2組封裝在一起的GPU Die（裸晶）與192GB HMB3e高頻寬記憶體所組成，為現今H100、GH200等Hooper架構GPU的接續產品，具有最高達30備的運算效能與25倍電力效率提升，與當代運算節點能夠帶來更強悍的效能表現，並在達成相同運算量的前提下大幅節省消耗的電力。

延伸閱讀：NVIDIA發表搭載HBM3e記憶體的H200 GPU，同時帶來4連裝水冷版

此外NVIDIA也發表了資料吞吐量提升1.8倍的NVLink交換器晶片，能夠在每條NVLink匯流排帶來雙向1.8 TB/s的資料傳輸速度，並可組織最多達576組GPU的運算節點，並且如DPU（資料處理器），每組夠提供提供3.6 TFLOPS的SHARP V4運算效能，將部分負載由CPU（處理器）或GPU轉移至DPU，釋放更多運算資源。

為了提升網路擴充性，NVIDIA也出了最高速度可達800 Gb/s的Quantum-X800 InfiniBand與Spectrum-X800乙太網路平台，以及GB200 NVL72的伺服器。

GB200 NVL72顧名思義由18組1U尺寸水冷伺服器構成，每台伺服器搭載2組GB200 Superchip（全機共有36組Grace架構CPU與72組Blackwell架構GPU），總體AI訓練效能可達720 FLOPS，AI推論效能則上看1,440 FLOPS，同時也搭載BlueField-3 DPF（資料處理器），可加速超大規模AI雲端運算與儲存、資安應用彈性。

與數量相同的前代H100 GPU相比，GB200 NVL72提供高達30倍的大型語言模型推論工作負載效能（使用混合專家模型，Mixture-of-Experts Model），並且提升25倍電力效率。

此外NVIDIA也發表了專為Transformer、大型語言模型和生成式AI等負載而設計的DRIVE Thor車載運算平台，採用Arm Neoverse V3AE CPU核心搭配Blackwell架構GPU，提供高達1,000 TFLOPS的效能，以確保自駕車的安全。

Image may be NSFW.
Clik here to view. 每組新型DGX SuperPOD具有8組或更多DGX GB200系統，可在FP4資料類型提供11.5 EFLOPS的AI 超級運算能力和240 TB 的HMB3e高頻寬記憶體，並可透過額外的機架擴展。 ▲ 每組新型DGX SuperPOD具有8組或更多DGX GB200系統，可在FP4資料類型提供11.5 EFLOPS的AI 超級運算能力和240 TB 的HMB3e高頻寬記憶體，並可透過額外的機架擴展。

Image may be NSFW.
Clik here to view. DRIVE Thor則為搭載Arm Neoverse V3AE CPU核心與Blackwell架構GPU的車載運算平台。 ▲ DRIVE Thor則為搭載Arm Neoverse V3AE CPU核心與Blackwell架構GPU的車載運算平台。

軟體功能撮合Omniverse與Apple Vision Pro

NVIDIA也將推出Omniverse Cloud API（應用程式介面），讓開發人員能將 Omniverse核心技術整合至現有的數位孿生設計和自動化軟體、測試和驗證機器人或自動駕駛汽車等自主機器的模擬工作流程等應用，並且可搭配Apple Vision Pro頭戴式顯示器。

針對人型機器人應用，NVIDIA也發表了以Thor SoC為基礎的Jetson Thor電腦與Isaac機器人平台的最新版本，提供用於模擬的生成式AI基礎模型和工具及AI工作流程基礎架構，並透過GR00T計劃（Generalist Robot 00 Technology，通用型機器人技術）加速機器人理解自然語言，並透過觀察人類行為來模仿動作。

NVIDIA也於GTC大會宣布，TSMC（台積電）和Synopsys將利用cuLitho運算微影平台（Computational Lithography）投入生產，加速製造並突破物理極限的先進半導體製程，並實現以350組H100 GPU的系統取代40,000組CPU的系統，在加快生產流程的同時降低成本、空間和電力。

Image may be NSFW.
Clik here to view. Omniverse Cloud API有助於將技術整合至現有。 ▲ Omniverse Cloud API有助於將技術整合至現有。

Image may be NSFW.
Clik here to view. Omniverse Cloud API也能搭配Apple Vision Pro頭戴式顯示器，強化顯示效果。 ▲ Omniverse Cloud API也能搭配Apple Vision Pro頭戴式顯示器，強化顯示效果。

Image may be NSFW.
Clik here to view. GR00T計劃能夠加速人型機器人的開發流程。 ▲ GR00T計劃能夠加速人型機器人的開發流程。

Image may be NSFW.
Clik here to view. cuLitho運算微影平台能在加速半導體生產流程的同時降低成本、空間和電力。。 ▲ cuLitho運算微影平台能在加速半導體生產流程的同時降低成本、空間和電力。。

GTC 2024春季展將於3月18至21日期間舉行，筆者將會持續帶來更多、更詳細相關新聞與報導，有興趣的讀者也可以參考GTC官方網站，瞭解更多線上與實體活動。

加入電腦王Facebook粉絲團

NVIDIA於GTC 2024春季場發表Blackwell GPU與NVLink交換器晶片，單顆GPU效能高達20PFLOPS

新世代AI運算晶片降臨

軟體功能撮合Omniverse與Apple Vision Pro

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本