Channel: 電腦王

↧

NVIDIA公布H200 MLPerf測試成績，表現較H100提高45%

March 27, 2024, 6:00 pm

≫ Next: OpenAI 仍在訓練 GPT-5，估計最快今年夏天發佈

≪ Previous: AI搜尋引擎還沒有辦法取代 Google 的真正原因

NVIDIA公布H200 GPU於MLPerf LLM測試成績，在Llama 2 70B項目的表現較H100提高45%，同時也說明TensorRT-LLM軟體更新能夠帶來近3倍的效能表現。 D8227c1404e4364c355d35dff11c3c55

D8227c1404e4364c355d35dff11c3c55

NVIDIA公布H200 GPU於MLPerf LLM測試成績，在Llama 2 70B項目的表現較H100提高45%，同時也說明TensorRT-LLM軟體更新能夠帶來近3倍的效能表現。

軟硬體雙管齊下強化效能

NVIDIA在MLPerf H200首次基準測試說明會中，先說明了在短短六個月中透過即時連續批次處理（In-Flight Sequence Batching）、KV快取記憶體管理與分頁最佳化、XQA核心最佳化、多GPU節點平行化、FP8資料類型量化等TensorRT-LLM軟體功能更新，讓H100 GPU（繪圖處理器）在MLPerf推論的GPT-J測試項目中，能夠帶來2.9倍的效能表現。

延伸閱讀：NVIDIA發表搭載HBM3e記憶體的H200 GPU，同時帶來4連裝水冷版Quad GH200

而在重頭戲LLM（大型語言模型）測試中，身為進階版的H200將記憶體由H100的80GB HBM3高頻寬記憶體提升為141GB HBM3e，不但容量有所增加，頻寬也由3.35 TB/s提升為4.8 TB/s，能夠帶來約45%的效能增益。

NVIDIA也提到，若使用強化散熱能力的客製化MGX伺服器，能夠進一步提高GPU的TDP限制，能帶來最高14%的效能增益。

▲ 隨著LLM（大型語言模型）的量體越來越大，推論運算難度與複雜度也隨之提高。

▲ TensorRT-LLM在近期版本更新中加入許多能夠改善效能的新功能。

▲ 回顧TensorRT-LLM的更新，陸續加入許多重要功能。

▲ 在MLPerf推論的GPT-J測試項目中，新版TensorRT-LLM能在伺服器情境帶來2.9倍的效能表現。

▲ H200 GPU搭載容量更大、頻寬更高的HBM3e高頻寬記憶體，能夠帶來約45%的效能增益。

▲ 客製化散熱方案MGX伺服器能夠額外帶來最高14%的效能增益。

▲ NVIDIA也自豪地表示自家仍上傳了所有MLPerf測試成績。

H200預計於2024年第二季開始出貨，由於它與H100的TDP規格相同，因此在使用官方建議設計的H100 HGX伺服器能夠直接更換為H200（Drop-in Replace），節省升級開支。

加入電腦王Facebook粉絲團

↧

Trending Articles

《沈冰自述——我和周永康的故事》全本

February 8, 2015, 9:08 pm

Moog - Subsequent 25

January 16, 2020, 12:00 am

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

March 9, 2013, 11:02 am

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

July 16, 2019, 11:03 pm

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

April 24, 2019, 6:56 am

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

October 28, 2019, 8:49 pm

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

December 28, 2017, 6:55 pm

acermark龍璿國際展出多款包裝設備

April 18, 2016, 6:02 am

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

October 15, 2018, 6:03 am

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

September 4, 2013, 2:57 am

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

June 23, 2020, 2:17 am

MAS v2.8 magicgenius 汉化版 - 11.11更新

November 10, 2024, 5:46 pm

出售: Monster Cable Interlink Reference 2

May 23, 2018, 2:00 am

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

August 17, 2015, 1:12 am

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

December 21, 2016, 9:38 pm

[转载]煞貢、直星、人專吉日\金神七煞歌

March 3, 2016, 6:37 am

HAKERS哈克士戶外 12月8~14日廠拍

December 6, 2016, 3:52 am

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

June 16, 2019, 8:10 am

<請教>行駛中安卓機會重新開機

August 5, 2018, 7:25 am

Udp2raw-tunnel 及其一键安装脚本

October 23, 2017, 6:46 pm

© 2025 //www.rssing.com