RTX2080/RTX2080Ti顯卡全面評測 RTX20系電腦顯卡怎么樣?(2)

2018-09-20 09:29:27 來源:快科技作者:佚名 人氣: 次閱讀 1782 條評論

作為GPU顯卡行業的領頭羊,NVIDIA的新產品發布節奏多年來一直非常穩,探析一下這個革命性的Turing架構,以及全新的RTX 2080 Ti、RTX 2080兩款高端型號到底表現如何。...

二、架構解析之全新內核體系

既然是一個全新設計的架構,我們就要好好看一看這個以計算機科學之父、人工智能之父艾倫·麥席森·圖靈(Alan Mathison Turing)命名的Turing圖靈新架構到底有哪些過人之處,不過硬件架構總是伴隨各種高深晦澀的技術名詞、技術原理,即便專業人士也得好好研究才行,所以這里我們僅從高級層面,介紹一下新架構的大致設計、技術概況,以及能帶來的實際好處。

在以往,NVIDIA為專業級計算卡、消費級游戲卡設計的都是統一架構,只是具體內部模塊布局、技術支持、核心大小不同。好處是可以統一開發,降低成本,壞處是缺乏針對性,技術資源要么浪費要么不夠。

這一次,NVIDIA選擇了分而治之。針對高性能計算、圖形渲染、人工智能、深度學習等專業應用的是Volta伏特架構,目前只有一個超大核心GV100,是迄今為止GPU歷史上最大的核心,臺積電12nm工藝制造,集成多達210億個晶體管,核心面積達815平方毫米,妥妥的怪物級核彈。

Se6516888-54bb-4e68-be0b-e139b5a78641.jpg

針對游戲顯卡的就是Turing圖靈架構,也是臺積電12nm(有說法稱最初計劃使用三星10nm),其中最大的核心TU102集成189億個晶體管,核心面積754平方毫米,是僅次于GV100的史上第二大GPU核心。

相比上代Pascal帕斯卡家族的大核心GP102,它的晶體管數量增加了55%,面積則增大了60%,甚至是次級新核心TU104都超越了GF102,擁有136億個晶體管、545平方毫米面積。

Se7f74e06-cf16-4ab5-9278-b9db212b9cd1.jpg

新架構核心之所以如此龐大,除了CUDA核心規模繼續增大、升級Shading著色渲染之外,更關鍵的是RT Core光線追蹤核心、Tensor Core人工智能核心的加入,這也是新架構革命性變化的根本支撐。

擁有全新著色性能的SM CUDA核心陣列、支持高達每秒100億條光線計算的RT光線追蹤核心、為實時游戲畫面導入AI人工智能加速的Tensor核心,三者就構成了圖靈架構的三大支柱,各自有不同分工又互相協作,共同實現新的游戲渲染畫面。

S51b52920-01f8-40ec-887b-96a65ba22c25.jpg

S4eee82a6-db03-4633-8257-6c4a5954a32a.jpg

同時,NVIDIA強調新架構的單個CUDA核心著色渲染性能是帕斯卡架構的1.5倍,第一次可以在4K分辨率、HDR開啟的情況下,提供流暢的游戲體驗,真正開啟4K時代。

按照NVIDIA的說法,RTX 2080就能基本實現4K分辨率下60FPS的游戲幀率,RTX 2080 Ti更是能夠達到70-80FPS。當然具體還要看游戲需求,以及游戲設置,特別是某些高要求的技術特性,光線追蹤打開后別說4K了,就連1080p就比較吃力。

S18b01090-0e3e-40a3-87f2-7bb89e7c80bc.jpg

圖靈架構的基本組成單元之一還是CUDA核心與SM流處理器陣列,這也是2006年的G80以來NVIDIA GPU的基石。

事實上,圖靈架構的SM陣列也融合了伏特架構的不少特性,相比帕斯卡架構差別還是挺大的,比如每一組TPC里的SM陣列由一個增至兩個,同時SM內部的組成方式也截然不同。

帕斯卡架構每個SM陣列集成128個FP32浮點單元,圖靈架構則改成了2個FP64雙精度浮點單元、64個FP32單精度浮點單元、64個INT32整數單元、8個Tensor核心、一個RT核心。支持浮點和整數并發操作,并有新的執行數據路徑,類似伏特架構匯總的獨立線程調度。

按照NVIDIA的統計,每執行100個浮點指令,平均會有36個整數指令,兩種指令可以并發執行。

如此一來,帕斯卡架構的整數和浮點計算就可以分配得更加均衡,并與新的Tensor、RT核心相配合,更合理、高效地完成各種負載。

整體而言,圖靈核心的CUDA陣列可以每秒執行14萬億次FP32浮點操作、14萬億次INT32整數操作。

Sebce40cd-168b-483f-9a53-432266258859.jpg

緩存架構也徹底變化,由兩個載入/存儲單元牽頭,一級緩存和共享緩存整合在一起,而且容量靈活可變,可以是64KB+32KB,也可以是32KB+64KB,大大降低了延遲,帶寬也翻了一番。

二級緩存容量則從3MB翻倍到6MB。

Sa93b9a01-bca1-4884-8ff1-6f75f7f144f2.jpg

NVIDIA宣稱,新架構每個CUDA核心的著色渲染性能比上代平均提升50%,部分游戲可達70%左右,VRMark虛擬現實測試成績甚至翻了一番還多。

當然這只是基礎理論上的數字,實際性能還要看其他部分和整體指標。

S1dfafcd5-b24e-4a25-a3a5-dcb72872b38a.jpg

圖靈架構還首發搭配新一代GDDR6顯存,目前業界最快,等效頻率高達14GHz,搭配352-bit位寬可以帶來616GB/s的驚人帶寬,相比于GTX 1080 Ti在位寬不變的情況下提升了27%,也比用了2048-bit HBM2高帶寬顯存的AMD RX Vega 64高了27%。

而且關鍵是,GDDR6的成本比HBM2低得多。

另外,NVIDIA還對新顯存進行了各種優化,信號竄擾降低了40%,更利于運行穩定和進一步超頻。

您可能感興趣的文章

相關文章