下一代Intel晶片,有巨大的性能提升。
每年一度的 Hot Chips 是半導體業界最重要的技術會議。在其中,晶片領域專家齊聚一堂,全球晶片廠商也經常選擇在這裡發表新產品,或是闡述未來的發展方向。
當地時間週一,在史丹佛大學舉辦的 Hot Chips 2023 上,Intel首次披露了新一代資料中心晶片「Sierra Forest」,它的每瓦性能較前代提升了 240%,並有望於明年推出。
同時,Intel首次將旗下資料中心晶片分為兩類:一類是 Granite Rapids,專注於高能耗高性能;一類是 Sierra Forest,專注於高能效。
接下來看 Granite Rapids 和 Sierra Forest 這兩款資料中心晶片的具體細節。
整體來講,得益於引入了面積高效的 E 核心(能效核心),Granite Rapids 和 Sierra Forest 將有望成為迄今為止Intel Xeon可擴充硬體生態系統中最重要的更新之一。
先來看 Sierra Forest,它是Intel首款用於資料中心的 E 核 Xeon 可擴充晶片,還是基於 EUV 的 Intel 3 工藝的主導產品。Intel表示,Sierra Forest 有望於明年上半年上市。同時,Granite Rapids 也採用相同的 Intel 3 工藝。
在設計上,Granite 和 Sierra 都是基於小晶片(chiplet)的設計,依賴透過Intel EMIB(Embedded Multi-Die Interconnect Bridge, 嵌入式多核心互聯橋接)技術封裝在一起的運算和 I/O 小晶片的混合。不僅如此,這次的小晶片設計還有獨到之處,使用不同的運算 / IO 小晶片,而不是將「完整的」Xeon 小晶片封裝在一起。
這意味著,Granite 和 Sierra 可以共用基於 Intel 7 工藝構建的、通用 I/O 小晶片。
除了共用平臺的詳細資訊外,Intel還首次提供了 E 核心和 P 核心(性能核心)所用架構的進階概述。正如現在多代 Xeon 的情況一樣,Intel正在利用與其消費部件相同的基本 CPU 架構。
因此,Granite 和 Sierra 可以被認為是解構的 Meteor Lake 處理器,Granite 配備 Redwood Cove P 核心,而 Sierra 配備 Crestmont E 核心。
如前所述,這是Intel首次嘗試為 Xeon 市場提供E核心。對Intel來說,這意味著要針對資料中心工作負載調整E核心設計,與上一代以消費級應用為中心的E核心設計大有不同。
Intel透露,Crestmont 正在提供 6-wide 指令解碼路徑以及 8-wide 隱退後端。雖然不如Intel的 P 核心強大,但E核心絕不是羽量級核心,Intel的設計決策反映了這一點。儘管如此,它的設計在晶片空間和能耗方面都比 Granite 中的P核心要高效得多。
Crestmont 的 L1 指令快取記憶體(I 快取記憶體)將為 64KB,是早期設計中 I-cache 大小的兩倍。與此同時,Crestmont E-core 系列的新成員可以將這些核心打包成 2 或 4 核叢集,這與目前僅提供 4 核叢集的 Gracemont 不同。最後,對於 Sierra/Crestmont,該晶片將提供與 Granite Rapids 盡可能接近的指令。這意味著有 BF16 資料類型支援,以及對各種指令集的支援,例如 AVX-IFMA 和 AVX-DOT-PROD-INT8。
同時對於 Granite Rapids,我們有 Redwood Cove P 核心。Redwood/Granite 是 Xeon 處理器的傳統核心,對於Intel來說,變化並不像 Sierra Forest 那樣大,但這並不意味著他們沒有改進。
在微架構方面,Redwood Cove 獲得了與 Crestmont 相同的 64KB I 快取,容量是其前身的 2 倍。但最值得注意的是,Intel成功地進一步降低了浮點乘法的延遲,將其從 4/5 個週期減少到僅 3 個週期。像這樣的基本指令延遲改進很少見,因此我們總是期盼能夠出現。
除此之外,Redwood Cove 微架構還有分支預測和預取等特性,這是Intel的典型最佳化目標。它們可以採取的任何措施來改進分支預測(並降低罕見失誤的成本),經常會在性能方面帶來相對較大的紅利。
Redwood Cove 的 AMX 矩陣引擎獲得了 FP16 支援,尤其適用於 Xeon 系列,而 FP16 的使用不如已支援的 BF16 和 INT8 那麼多,但它總體上改進了 AMX 的靈活性。
對於記憶體加密的支援也正在得到改進。Granite Rapids 的 Redwood Cove 將支援 2048 個 256 位元記憶體 key,而 Sapphire Rapids 則支援 128 個 key。
雖然現在談論 Granite Rapids 和 Sierra Forest 的各個 SKU 還為時過早,但Intel已明確告訴我們,核心數量總體正在增加。Granite Rapids 晶片將提供比 Sapphire Rapids 更多的 CPU 核心(SPR XCC 為 60 個)。當然,Sierra 的 144 個核心將提供更多的 CPU 核心。
在之前的 Xeon 推遲並花費很長時間才將 E 核 Xeon 可擴充晶片推向市場之間,Intel並沒有像以前那樣在資料中心市場佔據主導地位,因此 Granite Rapids 和 Sierra Forest 將象徵一個重要的反曲點,給Intel資料中心產品的未來發展指明了道路。
我們知道,為網際網路和線上服務提供動力的資料中心承載著巨量的算力需求,同時也需要消耗大量電力。最近幾年隨著 AI 等技術的發展,科技公司正面臨提升算力、降低能耗的挑戰,這促使晶片公司專注於提升功耗效率。
目前,在資料中心晶片市場,Intel的市佔率正一步步被 AMD 和 Ampere(前Intel高管 Renee James 成立的初創公司)等競爭對手蠶食。
今年,Ampere 和 AMD 都已推出了自己的高效率雲端運算晶片,Arm 也在本次的 Hot Chips 2023 上提出了 Neoverse V2 平臺。競爭愈加激烈的當下,Intel有危機感在所難免。
資料來源:
- Hot Chips 2023: Intel Details More on Granite Rapids and Sierra Forest Xeons
- Intel says new 'Sierra Forest' chip to more than double power efficiency