效能、功能雙雙升級
NVIDIA 每一代的顯示繪圖處理器架構更新,都能夠帶給消費者另外 1 個層級的效能體驗,這次隨著 DirectX 12 追加選配 API 集 raytracing 光線追蹤 DXR,推出能夠以硬體方式支援的 Turing 圖靈架構,不僅將效能推向另外 1 個層次,更可透過 DXR 標準 API 替遊戲畫面加入即時光影特效,提供過去光柵成像無法提供的畫質。
Turing 圖靈架構內部 L1 架構獲得改良,原本 Pascal 1 個 CUDA 儲存/載入單元連結 2 個 L1 24KB 著色器快取與 1 個 96KB 貼圖/暫存器快取,Turing 改良成 2 個 96KB 共 192KB L1 與共享快取,同時也將儲存/載入單元數量倍增。另一方面,Pascal 架構 CUDA 單元無法同時處理運算整數與浮點數,2 者運算時互斥,Turing 則改良此一情形支援並行處理,若是遊戲經常混雜使用整數與浮點數運算,Turing 架構能夠更快地計算完畢。
▲Turing 圖靈顯示繪圖架構改良 L1 與共享快取結構,不只記憶體空間加大,存取頻寬更是同時倍增。
繪圖技巧部分,NVIDIA 引薦 Mesh Shading 和 Variable Rate Shading,Mesh Shading 可以把由處理器負責的 LOD(Level Of Detail,根據物體距離攝影機遠近,套用不同程度的模糊處理)判斷、物件剔除(被物件所遮蔽的部分,無須花費時間運算),轉交由 GPU 進行,如此便可在畫面當中擺入更多的物件、三角形數量。
▲Mesh Shading 能夠將 CPU 的部分運算卸載至 GPU 身上,設計師便可在場景當中加入更多三角形數量,創造更逼真的環境。
Variable Rate Shading 則是個取巧運算,程式開發者可依據畫面的複雜度,諸如天空、水面、遠景等畫面細節較低的區域,選用較低的渲染速率;一般渲染速率均跟隨螢幕解析度,Variable Rate Shading 則可選擇 1x2、2x1、2x2、2x4、4x2、4x4 個像素才輸出 1 個顏色的方式,降低最小分割區 16x16 的渲染速率。透過降低畫面資訊量較低區域的渲染速率,達成提升畫面輸出速率的目標。
▲Variable Rate Shading 畫面最小分割單位為 16x16 像素,每個區域可以指定不同的畫面渲染速率,藉由減少 GPU 每個畫面的運算負荷量,提升單位時間內的 FPS 畫面輸出速率。
RT 與 Tensor 核心
CUDA 核心是 NVIDIA 自家對 GPU 內部 Stream Processor 串流處理器的稱呼,也是主要的運算單元,過去幾個世代的 GPU 均是在此做文章進行改良。到了 Turing 圖靈架構,NVIDIA 導入另外 2 個針對運算類型進行硬體特化的單元--RT 核心單元以及 Tensor 核心單元。
由於 DirectX 12 新增 DXR API 集,過去不統一的光線追蹤技巧實作,如今已有標準的統一格式,但是光線追蹤技法當中最重要的 BVH(Bounding Volume Hierarchies,用來描述空間當中物體關係的資料結構)遍歷,透過 Stream Processor 運算相當沒有效率,因此 NVIDIA 於 Turing 圖靈架構當中導入專門實作 BVH 遍歷的 RT 核心。
▲光線追蹤透過模擬物理現象,如光的折射、反射、散射等,因此需要理解空間物體的相對應關係,Turing 圖靈架構的 RT 核心就是專門負責處理的單元。
▲透過即時光線追蹤技術,能夠提供趨近於真實世界的影像品質或是照明效果。
另一方面,光線追蹤成像是否能夠與真實世界相似,取決於追蹤的光線數量,光線數量越多、畫面就更真實,光線數量較少、則會讓畫面出現雜點。由於遊戲需要相當快速的畫面生成速率,光線追蹤數量自然與 1 個畫格 1 個畫格慢慢運算的影片少了許多,因此需要一些小技巧加強畫面品質。
Tensor 核心專門負責深度學習神經網路相當重要的張量運算,而透過深度學習技巧,能夠替光線追蹤生成的畫面去除雜點;更進一步,NVIDIA 還利用 Tensor 核心單元加入 DLSS(Deep Learning Super Sampling)深度學習超高取樣反鋸齒,能夠在對效能衝擊更少的情況下,提供等同於 TAA 4X 甚至是以上的畫質。
▲Tensor 核心支援深度學習經常使用的張量運算,透過 DLSS 則能夠提供相對於 TAA 4X 以上的畫質,同時亦可減少效能開銷。
RTX 2000 系列完整體驗
NVIDIA 採用自家研發的 Turing 圖靈顯示繪圖架構,市場定位由高至低分別推出 GeForce RTX 2080 Ti、GeForce RTX 2080、GeFeForce RTX 2070、GeForce RTX 2060 等 4 款消費性產品。各款顯示卡依據其定位,分別擁有不同的 CUDA、RT、Tensor 核心單元以及記憶體數量,其中 GeForce RTX 2080 以上額外支援採用 NVLink 介面相互連結的 SLI 串聯運算模式,能夠加總 2 張顯示卡的運算能量。
▲GeForce RTX 2080 Ti~GeForce RTX 2060 規格比較表。
GeForce RTX 2000 系列具備 RT 核心和 Tensor 核心,因此能夠以硬體方式加速 DirectX 12 DXR 光線追蹤 API 以及自家 DLSS 反鋸齒技術。GIGABYTE 採用其中 2 款晶片推出 AORUS GeForce RTX 2080 XTREME 8G 和 AORUS GeForce RTX 2070 XTREME 8G,而掛在 AORUS 電競品牌之下,自然也有些不一樣的作為。
GIGABYTE AORUS 這 2 款顯示卡預先超頻至 1890MHz 和 1815MHz,並利用需占去 3 層介面卡厚度的散熱器保持顯示卡的運作穩定性。這組 WINDFORCE Stack 3X 散熱器不僅擁有較高的解熱效果,GIGABYTE 更採用特殊設計,將 LED 光線引導至風扇葉面末端,透過視覺暫流原理打造不一樣的效果,如果玩家機殼可以採用顯示卡直立式安裝,更不能錯過這款顯示卡帶來的視覺感官享受。
▲GIGABYTE AORUS GeForce RTX 2080 XTREME 8G 顯示卡,透過 WINDFORCE Stack 3X 散熱器風扇交互堆疊,讓整體長度控制在 300mm 之內。
▲透過散熱器縫隙觀察,AORUS GeForce RTX 2080 XTREME 8G 顯示卡具備 6 條直觸式熱導管負責引導廢熱至鋁質鰭片。
▲AORUS GeForce RTX 2080 XTREME 8G 顯示卡佔據 3 個介面卡槽位,還需要 2 個 PCIe 8pin 輔助電源,側邊亦設計有 AORUS 與 FAN STOP RGB LED 指示燈。
▲金屬背板也是少不了的標配,AORUS 鷹頭圖案同樣具備 RGB LED 燈光效果,一旁橘色防塵蓋,則是 NVLink 專用針腳。
▲AORUS GeForce RTX 2080 XTREME 8G 顯示卡提供玩家更彈性的視訊介面輸出,惟須注意其中 2 組 HDMI 2.0b 和 2 組 DisplayPort 1.4 共用線路,同時間僅能插上 1 條連接線材。
▲AORUS GeForce RTX 2080 XTREME 8G 顯示卡 RGB LED 燈光效果示意影片,透過視覺暫留原理打造漸變效果。
▲GIGABYTE AORUS GeForce RTX 2070 XTREME 8G 顯示卡,同樣採用 WINDFORCE Stack 3X 散熱器。
▲由於 AORUS GeForce RTX 2070 XTREME 8G 顯示卡 TDP 瓦數較前者略低,因此可觀察到僅採用 3 條直觸式熱導管設計,但直徑加大至 8mm。
▲AORUS GeForce RTX 2070 XTREME 8G 顯示卡同樣需佔據 3 個介面卡槽位,側邊也有 AORUS 和 FAN STOP RGB LED 指示燈,另外需要 1 個 PCIe 8pin 和 1 個 PCIe 6pin 輔助供電。
▲金屬背板與老大哥共用設計,AORUS 鷹頭圖案亦可呈現 RGB LED 燈光效果。
▲AORUS GeForce RTX 2070 XTREME 8G 顯示卡提供 3 個 HDMI 2.0b、3 個 DisplayPort 1.4、1 個 Type-C 輸出,其中 2 組 HDMI 和 DisplayPort 共用線路。
▲AORUS GeForce RTX 2070 XTREME 8G 顯示卡 RGB LED 燈光效果示意影片,採用另外 1 種特效方式呈現不一樣的感覺。
▲值得注意的是,上述 AORUS 顯示卡盒裝均附贈 1 組可自行組裝的金屬千斤頂,底部亦裝設磁鐵能夠吸附機殼,避免顯示卡太重而彎曲。
GeForce RTX 2060 GAMING OC PRO 6G,則是 GIGABYTE 採用具備 RT 與 Tensor 核心入門晶片 GeForce RTX 2060 所製成的超頻版顯示卡,也因為如此,散熱器選用 WINDFORCE 3X 版本,中央風扇旋轉方向與 2 側相反,藉此消彌風扇與風扇間氣流紊亂的問題。
GeForce RTX 2060 GAMING OC PRO 6G 即便沒有掛上 AORUS 品牌之名,GIGABYTE 依舊在側邊的商標設計 RGB LED 燈光特效,同樣能夠透過 RGB Fusion 2.0 進行同步控制。最高自動超頻時脈更不負 GAMING 電競之名,從預設 1680MHz 提升至 1830MHz。
▲GeForce RTX 2060 GAMING OC PRO 6G 顯示卡採用 WINDFORCE 3X 散熱器,中央風扇旋轉方向與 2 側相反,能夠消彌風扇與風扇間氣流打架的狀況,提升散熱效果。
▲GeForce RTX 2060 GAMING OC PRO 6G 顯示卡使用 4 條直觸式熱導管設計。
▲GeForce RTX 2060 GAMING OC PRO 6G 顯示卡須佔據 2 個介面卡槽位,並需要 1 個 PCIe 8pin 輔助供電,側邊 GIGABYTE 商標圖案仍然有安排 RGB LED 燈光效果。
▲GeForce RTX 2060 GAMING OC PRO 6G 顯示卡金屬強化背板印上 GIGABYTE 字樣。
▲視訊輸出連接埠部分,GeForce RTX 2060 GAMING OC PRO 6G 顯示卡提供 1 個 HDMI 2.0b、3 個 DisplayPort 1.4。
NVIDIA 於 Game Ready 驅動程式版本 425.31 之後,對過去 Pascal 時代 GeForce GTX 1060 6GB 版本以上顯示卡,增加 DXR API 支援能力,使其能夠享受光線追蹤帶來的畫面品質。只是 Pascal 架構並沒有 RT 核心單元專門用於 BVH 遍歷運算,改由 CUDA 串流處理器負責,因此執行效率較差。下列 3DMark Port Royal 測試項目可看出相關資訊。
▲AORUS GeForce RTX 2080 XTREME 8G、AORUS GeForce RTX 2070 XTREME 8G、GeForce RTX 2060 GAMING OC PRO 6G 與前一世代 Pascal 顯示卡的 3DMark Port Royal 得分比較。
3DMark Port Royal 總分可以看出 Turing 和 Pascal 世代在光線追蹤效能的差異,但依舊沒有實際遊戲畫面張數比較來得貼切。首先是第一款支援光線追蹤的遊戲 Battlefield V「戰地風雲 5」,在 1080p 解析度之下,Narvik Dock, Norway 第一場景,即便是 DXR Ultra 畫質選項,GeForce RTX 2060 GAMING OC PRO 6G 也有 60FPS 以上的表現,前一世代 Pascal 雖然也可享受新世代畫質,但就不是那麼流暢。
▲Pascal 世代少了 RT 核心單元,Battlefield V「戰地風雲 5」開啟 DXR 之後的表現明顯不如 Turing 世代。
Metro Exodus「戰慄深隧:流亡」則是較近期發售,同樣支援 DXR 光線追蹤的遊戲,並採用更消耗資源的全域照明技巧,替末日世界增添光影情境,並導入由 Tensor 核心單元負責的 DLSS 反鋸齒技巧。Pascal 時代 CUDA 串流處理器,此時不只額外負擔光線追縱運算,且無法如同 Turing 世代使用 DLSS,因此差距更為拉大。
▲Metro Exodus「戰慄深隧:流亡」採用光線追蹤裡的全域照明技巧,對顯示卡是個不小的負擔,未設有 RT 與 Tensor 核心單元的 Pascal 世代,相對 Turing 世代的效能表現差距更大。
或許玩家心中也會有疑問,「Turing 世代這麼好,但是我不玩這些光線追蹤遊戲,買了是不是白花錢?」針對這個問題,這裡選擇 3A 級遊戲 Tom Clancy's Ghost Recon Wildlands「火線獵殺:野境」以及講究畫面速率的遊戲 F1 2018 進行測試。
由以下測試結果能夠觀察到,無論是講究畫質的遊戲,或者是講究高畫面速率,Turing 世代 AORUS GeForce RTX 2080 XTREME 8G、AORUS GeForce RTX 2070 XTREME 8G、GeForce RTX 2060 GAMING OC PRO 6G 這 3 款顯示卡均有不錯的表現。
▲Tom Clancy's Ghost Recon Wildlands「火線獵殺:野境」遊戲當中,在 1080p 解析度,AORUS GeForce RTX 2070 XTREME 8G 以上可使用 Ultra 畫質,GeForce RTX 2060 GAMING OC PRO 6G 亦可使用 Very High。
▲F1 2018 最高 Ultra High 畫質,AORUS GeForce RTX 2080 XTREME 8G、AORUS GeForce RTX 2070 XTREME 8G、GeForce RTX 2060 GAMING OC PRO 6G 各款均有超越 60FPS 的表現,玩家不妨可以考慮 G-Sync 相容螢幕,獲得低延遲顯示效果。
GTX 1600 系列省電高效能
中高階產品線以外,NVIDIA 也沒有忘記照顧入門款式的消費族群,透過去除 RT 與 Tensor 核心單元,僅保留高效率的 Turing 世代 CUDA 串流處理器,製程同樣使用與 TSMC 深度合作的 12nm FFN,建構能源效率比值再度提升的 GeForce GTX 1600 系列顯示卡。
▲GeForce GTX 1600 系列規格比較表。
與前一世代 GeForce GTX 1060、GeForce GTX 1050 相符的是,TDP 瓦數並沒有變更,依舊是 120W 和 75W,因此 GeForce GTX 1660 Ti、GeForce GTX 1660 只需要額外插上 1 組 PCIe 6pin/8pin 輔助供電即可運作,GeForce GTX 1650 更是不用插電的 75W,因此相當適合小型電腦使用者升級,無須另行升級電源供應器。
GIGABYTE GeForce GTX 1660 GAMING OC 6G 選用 WINDFORCE 3X 散熱器,中央風扇採用與 2 側不同的轉動方向,減少風扇間的亂流加強散熱,而該顯示卡側邊 GIGABYTE 圖樣依舊有著 RGB LED 燈光效果。為了保留更多的供電餘裕,PCIe 輔助電源採用 8pin 版本,預設超頻幅度也來到 1860MHz。
▲GeForce GTX 1660 GAMING OC 6G 採用 WINDFORCE 3X 散熱器,中央風扇的旋轉方向與 2 側相反,避免風扇之間形成亂流。
▲透過觀察可以發現,GeForce GTX 1660 GAMING OC 6G 散熱器選用 3 條熱導管直觸式設計。
▲GeForce GTX 1660 GAMING OC 6G 需要佔去 2 個介面卡槽位,也需要 1 個 PCIe 8pin 輔助電源供應,側邊 GIGABYTE 字樣擁有 RGB LED 燈光效果。
▲背板材質選用塑膠,主要功能為防止誤觸短路。
▲視訊輸出埠安排 1 個 HDMI 2.0b、3 個 DisplayPort 1.4。
免額外插電的 GeForce GTX 1650 等級,GIGABYTE 推出 GeForce GTX 1650 OC 4G,在 TDP 75W 限制之下,依舊將自動超頻頻率提升至 1710MHz。散熱器則因為該晶片的發熱量不高,僅採用鋁擠切削散熱片形式,2 組風扇依然採用 GIGABYTE 這一世代慣用的正、反雙轉向設計,消彌傳統相同轉動方向,風扇與風扇間氣流容易打架的情形。
▲GeForce GTX 1650 OC 4G 在 TDP 75W 限制之下,自動超頻頻率調整至 1710MHz,並搭載正、反雙轉動方向風扇 WINDFORCE 2X 散熱器。
▲由於散熱器厚度的關係,GeForce GTX 1650 OC 4G 需要雙槽位安裝空間,但毋須連結 PCIe 輔助電源。
▲GeForce GTX 1650 OC 4G 視訊輸出提供 2 個 HDMI 2.0b、1 個 DisplayPort 1.4。
光說不練非君子,在深入探討 GeForce GTX 1600 系列的效能之前,先來看看與前一世代 GeForce GTX 1060、GeForce GTX 1050 的耗電量比較。在其餘零組件保持不變的情況下,GeForce GTX 1660 GAMING OC 6G、GeForce GTX 1650 OC 4G 耗電量前一世代相同。
▲GeForce GTX 1660 GAMING OC 6G、GeForce GTX 1650 OC 4G 與前一世代 Pascal 相同等級定位顯示卡的平台耗電量比較。
在耗電量不變的情況之下,透過遊戲來感受 2 代之間的效能差異將會更明顯,GeForce GTX 1650 甚至還多了 1GB 視訊專用記憶體。特別是 GeForce GTX 1650 OC 4G 顯示卡,相較前一世代無法在 Far Cry 5「極地戰嚎 5」、Assassin's Creed Odyssey「刺客教條:奧德賽」1080p 解析度繳出穩定 60FPS 畫面速率,GeForce GTX 1650 OC 4G 可於 Far Cry 5 調整至 High 畫質、Assassin's Creed Odyssey 調整至 Medium 畫質遊玩。
▲透過 Turing 圖靈世代的能源效率,在 TDP 不變的情況之下,GeForce GTX 1660 GAMING OC 6G、GeForce GTX 1650 OC 4G 遊戲效能提升幅度相當有感。
中高階享受畫質、入門亦有驚喜效能
NVIDIA 這次推出 Turing 圖靈世代顯示繪圖晶片,不僅在中、高階產品加入 RT 與 Tensor 核心單元,提供更高的畫面品質,讓消費者先行享受即時光線追蹤所帶來的視覺享受,入門款式更透過最佳化的 CUDA 串流處理器設計,在 TDP 不增加的情況之下,提供更好的運算效能。
身為重要合作廠商的 GIGABYTE,利用旗下 AORUS電競品牌之名,導入新穎 RGB Fusion 2.0 設計,利用人眼的視覺暫留現象創造 RGB LED 發光效果,全線散熱器風扇同步導入相反轉動方向設計,避免傳統設計於交界處風流方向不一致的問題,還有待機低溫停轉機制,一般作業提供 0dB 噪音量。文章最後安排 5 款 GIGABYTE Turing 圖靈世代顯示卡 3DMark 數據,提供玩家一致性的效能參考數據。
▲AORUS GeForce RTX 2080 XTREME 8G、AORUS GeForce RTX 2070 XTREME 8G、GeForce RTX 2060 GAMING OC PRO 6G、GeForce GTX 1660 GAMING OC 6G、GeForce GTX 1650 OC 4G 的 3DMark 效能測試數據圖表。
產品資訊
GIGABYTEAORUS GeForce RTX 2080 XTREME 8G
GIGABYTEAORUS GeForce RTX 2070 XTREME 8G
GIGABYTEGeForce RTX 2060 GAMING OC PRO 6G
GIGABYTEGeForce GTX 1660 GAMING OC 6G
GIGABYTEGeForce GTX 1650 OC 4G
測試平台
加入電腦王Facebook粉絲團
- 處理器:Intel Core i9-9900K
- 主機板:GIGABYTE Z390 AORUS Master
- 記憶體:Team T-FORCE NIGHT HAWK DDR4 3200 16GB Kit @2666MHz
- 系統碟:Plextor M9Pe(G) 512GB
- 作業系統:Microsoft Windows 10 Pro 64bit 1809