NVIDIA於SIGGRAPH 2023電腦圖像大會宣布多項消息,並發表搭載141GB HBM3e的GH200 Grace Hopper Superchip,以及RTX 5000、RTX 4500、RTX 4000等專業運算卡。
協助開發者訓練大型模型
NVIDIA與美國機器學習公司Hugging Face宣布合作提供生成式AI運算服務,協助開發者訓練大型語言模型(LLM)和各式AI相關應用程式、模型。
Hugging Face將在未來幾個月內推出名為「訓練叢集即服務」(Training Cluster as a Service)的新服務,讓開發者能在Hugging Face平台上利用NVIDIA DGX Cloud AI 超級運算服務訓練和調整AI模型,有助推動大型語言模型、聊天機器人、搜尋和摘要等應用程式,以簡化企業建立全新自訂生成式AI模型的過程。
受益於整合DGX Cloud,開發者只需在Hugging Face平台點擊幾下滑鼠,就能利用NVIDIA多節點AI超級運算平台,每個DGX Cloud執行個體都搭載8組H100或A100 GPU,合計GPU記憶體容量高達640GB,搭配高效能、低延遲的NVIDIA網路結構,確保工作負
此外NVIDIA也宣布推出NVIDIA AI Workbench,讓開發者在桌上型電腦或工作站建立整合易用的工作空間,以利快速建立、測試和自訂預先訓練生成式AI大型語言模型,然後再部署至資料中心、公有雲或 NVIDIA DGX Cloud。
擴大OpenUSD生態系統
NVIDIA先前也透過AOUSD聯盟推廣OUSD格式3D描述檔案,這次則是宣布推出Omniverse平台重大升級。
Omniverse是用於連接、描述和模擬各種基於OpenUSD的3D工具及應用程式的軟體平台,這次更新加快了建立虛擬世界與工業數位化的先進工作流程,Cesium、Convai、Move AI、SideFX Houdini、Wonder Dynamics等開發環境已可透過 OpenUSD連接到Omniverse平台,為開發者與企業提供嶄新的基礎應用程式及服務,利用OpenUSD框架和生成式AI改善並加速3D開發工作流程。
圖庫公司Shutterstock也宣布推出基於NVIDIA Picasso生成式AI的服務,透過完全授權、保留使用版權的資料所開訓練的AI模型,讓使用者只需輸入簡單的文字或圖片提示,就能快速產生360度、8K解析度、高動態範圍成像(HDRi)的環境貼圖。
過去建立3D場景需要購買昂貴的360度攝影機,從頭開始建立背景和環境貼圖,或者要從可能無法精確匹配的現有貼圖資源中挑選。而現在使用者只需提供文字或圖片提示,Picasso的360 HDRi服務就能速生成全景圖像,使用者還可以自訂貼圖、快速反覆調整修改各種想法,直到出現滿意的結果,大幅簡化產生3D場景的工作流程。
另一方面,Autodesk也利用Picasso的基礎模型所開發出的生成式人工智慧內容創作服務,與3D開發軟體Maya整合,讓使用者免去處理繁瑣的工作,盡情發揮天馬行空的創意。
全新硬體助陣
NVIDIA這次推出最「大樣」的產品是強化版的GH200 Grace Hopper Superchip,它以先前發表的Grace Hopper Superchip為基礎,但將原本最高搭載96GB HBM3的GPU記憶體擴展至141GB HMB3e,不但提供更高的頻寬與傳輸速度,容量也有所提升,對於AI運算來說有相當大的幫助。
NVIDIA也推出RTX 5000、RTX 4500、RTX 4000等專業運算卡,它們採用最新Ada Lovelace架構,搭載單精度浮點運算效能達前代產品2倍的全新CUDA核心,以及第3代光線追蹤核心與第4代Tensor核心,大幅提升光線追蹤與AI運算效能,並擴展對FP8資料格式的支援度。
新推出的運算卡也搭載容量更大的GPU記憶體,3款產品分別搭載32GB、24 GB、20GB GDDR6記憶體,均支援ECC(修正錯誤代碼),可對大型3D模型、渲染影像、模擬和AI進行無錯誤運算。
NVIDIA也與BOXX、Dell、HP、Lenovo等製造商合作推出新款RTX工作站,最多可安裝4張RTX 6000運算卡,達到總合5,828TFLOPS的AI運算效能與192GB GPU記憶體。另可視需求在系統內部署NVIDIA AI Enterprise或Omniverse Enterprise,以處理各種生成式AI和圖形密集型工作負載。
NVIDIA也推出搭載新款L40S GPU的OVX伺服器,每組OVX伺服器最多可安裝8組L40S GPU,張量(Tensor)運算超過1.45 PFLOPS。
L40S也是Ada Lovelace世代架構,配備48GB GPU記憶體,具有18,176組CUDA核心,單精度浮點運算(FP32)效能幾乎是A100 GPU的5倍,此外還有142組第三代RT核心,提供212TFLOPS的光線追蹤運算效能,以支援實時渲染、產品設計和創作3D內容、影片處理和工業數位化等專業視覺化工作流程。
對更多NVIDIA在SIGGRAPH 2023所發表的資訊有興趣的讀者,可以前往NVIDIA特設網站,或觀看主題演講重播。
加入電腦王Facebook粉絲團