第二代 Ryzen Threadripper 的變與不變
由於採用相同的晶片設計,因此第二代 Ryzen 相關特性,也被第二代 Ryzen Threadripper 完整繼承,諸如改換 12nm LP 製程與 Zen+ 微架構,達到更高頻率也更省電的目標,L1、L2、L3、系統記憶體的存取延遲同時下降,詳情可以參閱我們先前的報導。
▲Zen+ 可減少快取記憶體與系統記憶體的存取延遲。
▲12nm 製程往上推升運作時脈,同時脈耗電量相較前一代 14nm 更低。
▲Ryzen Threadripper 2950X 相對於 Ryzen Threadripper 1950X,於密集運算應用提升幅度約為 2%~5%。
另外一點,將高速儲存區讀寫速度優勢,與低速儲存區便宜大容量相互融合的 StoreMI 技術,AMD 也開放給第二代 Ryzen Threadripper 處理器使用。更有勝者,第一代 Ryzen Threadripper 也可以免費下載 StoreMI 軟體使用,意即採用 X399 晶片組的主機板全線支援 StoreMI。(疑?好像有 X370、B350、A320 晶片組的敲碗聲?)
▲第一代 Ryzen Threadripper 和第二代 Ryzen Threadripper 2920X、Ryzen Threadripper 2950X 僅使用處理器封裝內部 2 個晶粒。
▲Ryzen Threadripper 2970X 和 Ryzen Threadripper 2990X 開啟使用第三、第四個晶粒,各晶粒之間均有專屬的 Infinity Fabric 通道相互連結。
在第一代 Ryzen Threadripper 處理器封裝當中,有 2 個沒有開啟核心的晶粒,到了第二代 Ryzen Threadripper 2970X 和 Ryzen Threadripper 2990X,將封裝內部晶粒分別開啟 6 個實體核心和 8 個實體核心,乘上 4 顆晶粒就有 24 個實體核心和 32 個實體核心。
不過 Ryzen Threadripper 2970X 和 Ryzen Threadripper 2990X 第三、第四個晶粒的 SoC 週邊連結性部分並沒有同步變更,因此 PCIe、USB 3.1 Gen1、USB 3.1 Gen2、SATA 6Gb/s 通道數量與第一代無異;第三、第四個晶粒的記憶體控制器也是同樣的情形,因此第二代 Ryzen Threadripper 記憶體模組依舊維持 4 通道 8 插槽的配置。
Intel mesh 與 AMD Infinity Fabric
處理器內部多核心溝通部分,Intel Skylake-X 採用 mesh 互連架構連結內部多個核心、PCIe 控制器、記憶體控制器等;AMD 則是從 Zen 微架構以來,以 4 個實體核心為 CCX(Core Count Complex)單位,藉由 Infinity Fabric 連結位於同一晶粒的另外 1 組 CCX、Radeon RX Vega、記憶體控制器、I/O 集線器等,同時也利用 Infinity Fabric 連結同一封裝其它的晶粒,如 Ryzen Threadripper 和 EPYC。
▲Intel mesh 互連結構,點對點路由決策為先垂直、後平行。
▲AMD Infinity Fabric 不僅可以做到單一晶粒內部功能區域相互連結,還可以利用它作為封裝內部各個晶粒的相互連結(最多 4 個 Zeppline 互連),以及 Socket 處理器插槽之間的連結(最多 2 個插槽)。
2 種設計各有利弊,由於 Intel mesh 是網狀架構,加上 mesh 預設運作時脈大約在 2GHz 以上,可以提供不錯的傳輸頻寬與低延遲。AMD Infinity Fabric 則是彈性較大,可以在較低的成本組合出更多核心,但是當存取路徑越遠,延遲也就越大、頻寬越小。再者,Intel mesh 運作頻率可以自由設定,目前 AMD Ryzen 系列處理器 Infinity Fabric 運作時脈和記憶體相互綁定,為DDR4 等效時脈的一半。之所以相互綁定,AMD 官方說法為減少資料穿越不同頻率域的延遲。
Local Mode & Distribute Mode
僅啟用封裝內部 2 個晶粒的 Ryzen Threadripper 2920X 和 Ryzen Threadripper 2950X,記憶體部分加入 Local Mode 與 Distribute Mode 2 種存取模式,分別對應 NUMA(Non-Uniform Memory Access)和 UMA(Uniform Memory Access)模式。若是讀者想要進一步理解相關資訊,可以參考我們先前的報導。
由於 Ryzen Threadripper 單一 Zeppelin 晶粒設計只能管理雙通道 4 插槽記憶體模組,因此 Ryzen Threadripper 的 4 通道 8 插槽規格,實際分別交由 2 個晶粒各自管理一半,因此某個處理器核心存取同一晶粒記憶體控制器所管理的記憶體空間,與存取另外 1 個晶粒所管理的記憶體空間,其頻寬表現和存取延遲不盡相同。
當使用者安裝封裝內部 2 個晶粒的 Ryzen Threadripper 處理器時,預設為 Distribute Mode(UMA)模式,此時作業系統將記憶體存取分散至所有的記憶體空間,頻寬最大、延遲也比較大。手動調整為 Local Mode(NUMA),則作業系統盡量將處理程序和記憶體存取限制在同一節點(同一晶粒),雖然記憶體存取頻寬因而受到限制,但延遲也會同步下降,對於遊戲類應用較為有利。(註:開啟封裝內部 4 個晶粒的 Ryzen Threadripper 2970WX 與 Ryzen Threadripper 2990WX,不支援 Local Mode)
▲Distribute Mode 記憶體頻寬最大,存取延遲相對也比較高。
▲Local Mode 記憶體頻寬較低,存取延遲降至 70.9ns,對於遊戲應用較為有利。
▲Ryzen Master 介面還有個 Legacy Compatibility Mode,開啟後減少處理器核心數量,避免偵測到超過軟體上限的核心數量,讓軟體無法運作。
Precision Boost Overdrive
第二代 AMD Threadripper 實體核心數量高達 32 核心,除非執行運算密集型或高度平行化作業,否則並無法享受這麼多核心所帶來的運算能力。傳統觀念認知,軟體要跟上處理器的核心數量,善用多核心完成工作,需要 1 年~2 年的時間,因此 AMD 於第一代 Ryzen 系列處理器推出之時,即加入 Precision Boost 和 XFR 功能。
Precision Boost 能夠根據目前工作中執行緒數量,自動調整處理器的超頻時脈,執行緒越少,提升效能的幅度就越高。而 XFR 則根據使用者的散熱系統強弱或是運作環境溫度,允許處理器在 Precision Boost 基礎再往上提升時脈。第二代 Ryzen 和 Ryzen Threadripper 加強判斷調整機制,調整細粒度以執行緒為單位,而非第一代 Ryzen Threadripperr 僅有 2 個 Precision Boost 時脈。
第一代 Ryzen Threadripperr 僅有 2 個 Precision Boost 時脈,分為 four-core boost 和 all-core boost,第二代 Ryzen Threadripper 導入 Precision Boost 2,依據工作中執行緒數量的不同,均可對應至適合的時脈(以 25MHz 為單位)。同理,XFR 2 現在的調整細粒度同樣以執行緒為單位。
▲第二代 Ryzen Threadripper 導入 Precision Boost 2,細粒度以執行緒為單位,因此能夠提供更為線性的調整範圍。
透過 SenseMI 監控功能,能夠以每秒 1000 次的頻率監控晶片電壓、電流、耗電量、溫度,再以這些資訊為本推導出 Precision Boost 2 和 XFR 2。另外第二代 Ryzen 和 Ryzen Threadripper 再導入 Precision Boost Overdrive 功能,此功能先前於第二代 Ryzen 處理器推出之際即可窺見相關文字,但直到第二代 Ryzen Threadripper 問世才將此功能調整完成。
overdrive 有著以硬體規範之外的參數運作之意,因此讀者可以猜到這是個超頻功能,以 XFR 2 強力散熱器的基礎,再要求主機板 VRD/VRM 能夠提供表定規格之外的供電能力,也就是主機板供電能力越強,處理器有可能自動超頻到相對 XFR 2 還要高的運作頻率。
新版 Ryzen Master 軟體加入此項 Precision Boost Overdrive 開關,由主機板回報 VRD/VRM 相關供電能力數值,如 PPT(Package Power Target,主機板處理器插槽的功率容量)、TDC(Thermal Design Current,主機板 VRD/VRM 能夠持續提供的最大電流)、EDC(Eletrical Design Current,主機板能夠提供的峰值電流),使用者能夠自行定義調整為更高的數值,之後讓處理器使用調整過後的數值並自動超頻。
▲新版 Ryzen Master 加入 Precision Boost Overdrive,使用者可以調整 PPT、TDC、EDC 數值,再交由系統自行判斷超頻幅度。
此功能聽起來和手動超頻十分類似,使用 Precision Boost Overdrive 也會因為除外條款而失去保固,但 Precision Boost Overdrive 和 Precision Boost 2 功能可以搭配使用,手動超頻就沒有這樣的福利。
Wraith Ripper 風冷散熱器
此次隨著第二代 Ryzen Threadripper 處理器,官方與 Cooler Master 共同合作推出 1 款 Wraith Ripper 風冷散熱器,雙塔型散熱鰭片中間夾著 1 個 120mm 風扇,散熱器頂端安排 AMD Ryzen Threadripper 字樣並融入 RGB LED 燈光,TDP 解熱能力為 250W,因而能夠應用於 Ryzen Threadripper 2970WX 和 Ryzen Threadripper 2990WX 處理器。
使用者須注意第一、第二代 Ryzen Threadripper 處理器 Tctl 均為 Tjunction(晶粒與金屬上蓋 IHS 之間的溫度)再加上 27℃,比較容易讓風扇轉速飆高,玩家可以自行調整風扇溫度與轉速對應曲線,亦或是直接使用水冷散熱器。
▲Wraith Ripper 除了和處理器相互接觸的底座之外,其餘外露金屬均施以黑漆加強質感並預防年久生鏽。
正式安裝時,Wraith Ripper 過於巨大,雖然鰭片經過特殊設計,能夠閃過最接近處理器插槽的記憶體模組插槽,但還是會略微侵犯該插槽領空,較高的記憶體模組可能無法安裝。此外該散熱器並非偏心結構,碩大體積佔據主機板第一組介面卡插槽的安裝空間,對於強調 PCIe 通道數量的 Ryzen Thrreadripper 處理器與 X399 晶片組平台而言,是個相當匪夷所思的設計。
來自 Cooler Master 訊息表示,Wraith Ripper 將於 9 月初於台灣地區販售,預計建議售價為美金 100 元,折合約新台幣 3,100 元。
(下一頁:耗電量、溫度、效能。)
耗電量與 Core i9-7900X 同級
時間關係,筆者先行取得 Ryzen Threadripper 2950X 進行測試,這款處理器要價美金 899 元,折合約新台幣 28,000 元,對手當然是同級同價位 Intel Core i9-7900X 處理器。首先進行耗電量與溫度測試,Ryzen Threadripper 2950X 採用風冷散熱器 Ryzen Ripper,解熱能力為 250W;Core i9-7900X 則是 SilverStone HE01,解熱能力 300W。
▲Core i9-7900X 與 Ryzen Threadripper 2950X 耗電量與溫度比較。
Ryzen Threadripper 2950X 的溫度數值為 Tjunction,並非加上 27℃ 的 Tctl,其餘零組件請見文末。2 者耗電量基本上位於同一級距,Ryzen Threadripper 2950X 於 Blender Benchmark 的耗電量稍高,Core i9-7900X 則是溫度稍高一些,若玩家願意破壞保固開蓋改換液態金屬散熱膏,則溫度可以下降不少。
Ryzen Threadripper 2950X 揚眉吐氣
接著進行雙方效能比較,Ryzen Threadripper 2950X 記憶體採用 2 組 G.SKILL Flare X F4-3200C14D-16GFX 8GB x 2 套裝,組成 4 通道共 32GB 容量,手動選擇等效時脈 DDR4-2933 和 Command Rate 1T,Asus Zenith Extreme 主機板自動選擇 16-16-16-39 時序。Core i9-7900X 採用相同的記憶體模組,手動選擇等效時脈 DDR4-2666 與 Command Rate 1T,ASRock X299 Killer SLI/ac 自動選擇 19-19-19-44 時序。
▲由 AIDA64 快取與記憶體頻寬測試可以發現雙方架構有著很大的不同,Core i9-7900X 越接近處理器核心的記憶體層級相較對手更為快速,離核心越遠,Ryzen Threadripper 2950X 頻寬表現即可超越對手。
▲Ryzen Threadripper 2950X 處理器實體核心數量高達 16 核心,CPU-Z 測試輕鬆贏過對手。
▲SiSoftware Sandra 28.18 除了多媒體表現相較對手為低,其餘測試均可依靠更多的實體核心取勝。(註:因軟體支援性問題,科學分析與影像處理沒有數據。)
上方理論值表現部分,Ryzen Threadripper 2950X 依靠更多的實體核心與執行序數量,能夠在多數測試項目贏過相同價位帶的 Core i9-7900X,唯有 SiSoftware Sandra 多媒體測試項目依然落後,該項目主要測試處理器的浮點運算效能與 AVX 指令集,正好是 Zen 架構的弱項。
接著筆者選擇 7-Zip 18.05 內建測試程式,檢查雙方的加解密性能,影片壓縮部分則選擇 x264 FHD Benchmark v1.01 和 HWBOT x265 Benchmark v2.0.0,分別測試雙方的影片轉檔能力。多核心處理器不可避免的 3D 繪圖運算部分,則找來 POV-Ray 3.7.0、CINEBENCH R15、Corona 1.3、Blender v2.79b 等常見繪圖程式,其中 Blender 測試場景採用 Benchmark、BMW、Classroom 等 3 種。
▲Ryzen Threadripper 2950X 處理器依靠更多的核心數量,7-Zip 表現相當優異。
▲影片轉檔的效能雖然沒有跟上雙方實體核心差距,但是 Ryzen Threadripper 2950X 依然超越對手 13%~40%。
▲3D 繪圖以核心執行緒數量為依歸,Ryzen Threadripper 2950X 不出意外拿下全勝。
AVX 指令集為分野
由以上測試項目可以得知,Ryzen Threadripper 2950X 處理器能夠依靠 16 核心 32 執行緒,以更多更暴力的計算資源贏過對手 Core i9-7900X,但唯獨 AVX 指令集測試例外。Zen 架構相容 AVX2 指令集,卻利用取巧的方式實作,需要 2 個時脈週期才能夠完成一次 256 位元運算(以時間換取電晶體空間),Intel 近期微架構均可在 1 個時脈週期完成,除此之外,Skylake-X 微架構還支援更先進的 AVX-512 指令集。
我們可以如此分析,若是使用者的計算作業能夠平行運算,Ryzen Threadripper 2950X 是個比較好的選擇,同時支援 ECC 記憶體提升電腦運作穩定性。倘若計算作業採用大量的 AVX2、AVX-512 指令,則 Core i9-7900X 可以帶給使用者更多的運算能力。
廠商資訊
延伸閱讀
- AMD Ryzen Threadripper 2000 系列官方規格釋出,開賣價便宜美金 100 元
- AMD Ryzen Threadripper 2990WX TDP 再創 250W 新高,市面相容 TR4 散熱器大盤點
測試平台
加入電腦王Facebook粉絲團
- Intel:
- 主機板:ASRock X299 Killer SLI/ac
- 記憶體:G.SKILL Flare X F4-3200C14D-16GFX 8GB x 2 x 2 @2666MHz
- 顯示卡:PowerColor Red Devil Radeon RX 580 8GB GDDR5 AXRX 580 8GBD5-3DH/OC
- 系統碟:Plextor M9Pe(G) 512GB
- 電源供應器:Seasonic Platinum 1000W
- 作業系統:Microsoft Windows 10 Pro 64bit 1803
- AMD:
- 主機板:Asus Zenith Extreme + Cooling Kit
- 記憶體:G.SKILL Flare X F4-3200C14D-16GFX 8GB x 2 x 2 @2933MHz
- 顯示卡:PowerColor Red Devil Radeon RX 580 8GB GDDR5 AXRX 580 8GBD5-3DH/OC
- 系統碟:Plextor M9PeGN 512GB
- 電源供應器:Seasonic Platinum 1000W
- 作業系統:Microsoft Windows 10 Pro 64bit 1803