最近Intel公佈了Ponte Vecchio 伺服器GPU建構平台的更多細節,包括性能資料。說明代號「Sapphire Rapids」的Xeon伺服器處理器,搭配代號「Ponte Vecchio」的伺服器GPU建構平台,相比NVIDIA的A100 GPU可對應2.5倍運算效能。
Ponte Vecchio GPU基於全新的Xe HPC高性能計算架構,使用5種不同製程(Intel 7和台積電N7/N5等)、多種封裝技術,整合了多達47個不同計算模組,電晶體數量超過1000億個。
它一個模組有128個Xe核心、128個光追單元、64MB一級快取、408MB二級快取、128GB HBM2e高頻寬記憶體,支援PCIe 5.0,可以四路甚至八路並聯。
Intel的最新資料聲稱,Ponte Vecchio FP32單精度、FP64雙精度性能可達52TFlops,TF3.2浮點性能可達419TFlops,BF16、PF16浮點性能可達839TFlops,INT8整數性能則可達1678Tops。
Data Parallel C++ (DPC++)測試計畫中,Ponte Vecchio的性能相比於NVIDIA A100可以領先1.4-2.5倍。
另外,ExaSMR OpenMC計算性能可領先2倍,NekRS性能則領先0.3-1.7倍。
當然,NVIDIA新一代的H100都已經發佈了……
Ponte Vecchio的使命是將聯合下一代可擴展Xeon Sapphire Rapids,用於美國的首批三台百億次超級電腦之一Aorura,但不幸的是,Sapphire Rapids一再延後,預計明年第二季才能發佈,Ponte Vecchio也一直沒有量產上市。
相比之下,AMD三代EPYC處理器、Instinct MI250X加速卡組成的Frontier已經上線執行,並達到1.6EFlops的性能。
加入電腦王Facebook粉絲團