NVIDIA公布H100 GPU MLPerf效能成績，最高較前代A100提升6.7倍

NVIDIA公布最新MLPerf效能成績，除了新款H100 GPU具有亮眼表現之外，現有的A100也透過軟體最佳化而有所進步。 87eb2e63ae9b813a60cf7e32a75fab28

NVIDIA公布最新MLPerf效能成績，除了新款H100 GPU具有亮眼表現之外，現有的A100也透過軟體最佳化而有所進步。

AI訓練基準測試橫掃千軍

MLPerf是產業用於衡量AI效能的測試基準，包括Amazon、Arm、Baidu、Google、Intel、Meta、Microsoft，以及哈佛大學、史丹佛大學、多倫多大學在內的眾多業者與學術單位皆支持這項標準。

在最新公布的MLPerf效能成績中，採用Hopper架構的H100 GPU在所有企業作業負載的8項測試中皆創下訓練模型的世界紀錄，其中表現最好的BERT項目成績較前代A100 GPU高出6.7倍

在獨立的MLPerf HPC基準測試之超級電腦科學作業負載中，A100 GPU在AI訓練模型所有測試項目都拔得頭籌。而A100 GPU也透過不斷改善的軟體堆疊，在CosmoFlow測試訓練AI模型的成績較2年前首次MLPerf HPC測試的最佳結果還要高出9倍。在同樣的作業負載中，每個A100晶片效能也比其他產品高出66倍之譜。

▲ H100 GPU的MLPerf效能成績前代A100最多提升6.7倍，A100也透過軟體最佳化提升2.5倍。

▲ 這次公開最新的測試成績為MLPerf訓練v2.1與MLPerf HPC v2.0。

▲ MLPerf訓練v2.1具有多種影像分類、物品偵測、醫學影像、語音辨識、自然語言處理、推薦、增強學習等項目，而MLPerf HPC v2.0則有天體物理學、天氣預測及分子動力學等項目。

▲ 從測試圖表可以看到H100與A100的進步。圖中1X的基準線為A100初次提交的成績。

▲ A100 SuperPOD的效能遠優於Intel的Gaudi2、Sapphire Rapids等處理器。（圖表單位為訓練使用時間，越短越好，打叉為沒有提交成績）

▲ H100在BERT測試項目中的表現比Gaudi2高出2.4倍，比Sapphire Rapids高出27倍。

NVIDIA表示受益於Transformer引擎，讓Hopper架構GPU在訓練用於自然語言處理的熱門BERT模型時有極為出色的表現，H100 GPU業在初登場打破MLPerf 推論基準測試紀錄的2個月後，又在產業組織的AI訓練最新測試中，創下處理企業AI作業負載的全新世界紀錄。這些測試結果顯示，對於建立與部署最先進AI模型以要求最高表現的用戶來說，H100是最佳選擇。

加入電腦王Facebook粉絲團

NVIDIA公布H100 GPU MLPerf效能成績，最高較前代A100提升6.7倍

AI訓練基準測試橫掃千軍

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本