GeForce GTX 1080首發(fā)評(píng)測(cè) 締造性能神話(2)
今年被很多人認(rèn)為是VR元年,醞釀了多年的VR終于呈現(xiàn)出井噴式增長(zhǎng);今年同樣是GPU的爆發(fā)之年,時(shí)隔5年,28nm的GPU終于退出歷史舞臺(tái),全新的14/16nm制程開始大放光彩。隨著NVIDIAPascal架構(gòu)和AMDPolaris顯卡的大幅。...
似是故人的新架構(gòu)
GeForceGTX1080采用了兩年前就已在GTC上被老黃透漏的全新架構(gòu)――Pascal,“Pascal”依然取自一位著名物理學(xué)家的名字,國(guó)際單位制中壓力的單位“Pa”即以其姓氏命名。Pascal架構(gòu)的第一款產(chǎn)品是4月初發(fā)布的TeslaP100,其采用GP100大核心,而這次發(fā)布的GTX1080則是采用GP104核心,具體型號(hào)為GP104-400,次旗艦GTX1070為GP104-200。GP104核心面積約為314平方毫米,得益于16nm的制程優(yōu)勢(shì),核心內(nèi)集成了72億晶體管,是GTX980晶體管數(shù)量的1.38倍,核心面積卻僅為GTX980的78.9%。
NVIDIAGP104-400核心
基于Pascal架構(gòu)的GM204-400芯片運(yùn)算資源總量為2560個(gè)ALU,TFU數(shù)量為160個(gè),后端的ROPs數(shù)量為64個(gè),四個(gè)帶寬為64bit的雙通道顯存控制器組成了總量為256bit的顯存控制單元,大小為8GB。同GTX980相比,其各項(xiàng)參數(shù)均有所提升,尤其是顯存帶寬達(dá)到了320GB/s,這是因?yàn)槠渎氏炔捎昧薌DDR5X顯存,GDDR5X顯存的改進(jìn)使得GTX1080在位寬相同的情況下?lián)碛懈叩膸挘跗诩纯蛇_(dá)到10-12Gbps,而隨著進(jìn)一步的研發(fā)最高能夠提升到16Gbps。
顯卡規(guī)格比較表 | ||||
顯卡型號(hào) | GTX1080 | R9FuryX |
GTX980 |
GTXTitanX |
首發(fā)限價(jià) | /$599 | /$649 | /$549 | /$999 |
GPU代號(hào) | GP104 | FijiXT | GM204 | GM200 |
GPU工藝 | 16nm | 28nm | 28nm | 28nm |
GPU晶體管 | 7.2B | 8.9B | 5.2B | 8B |
著色器數(shù)量 | 2560 | 4096 | 2048 | 3072 |
單精度浮點(diǎn) | 9T | 8.6T | 5T | 7T |
ROPs數(shù)量 | 64 | 64 | 64 | 96 |
紋理單元數(shù)量 | 160 | 256 | 128 | 192 |
核心頻率 | 1607MHz | 1050MHz | 1126MHz | 1000MHz |
boost頻率 | 1733MHz | 1050MHz | 1216MHz | 1075MHz |
架構(gòu) | Pascal | GCN | Maxwell | Maxwell |
顯存頻率 | 2500MHz | 500MHz | 1753MHz | 1753MHz |
內(nèi)存位寬 | 256bit | 4096bit | 256bit | 384bit |
內(nèi)存帶寬 | 320GB/s | 512GB/s | 224GB/s | 336GB/s |
內(nèi)存類型 | GDDR5X | HBM | GDDR5 | GDDR5 |
內(nèi)存容量 | 8GB | 4GB | 4GB | 12GB |
注:表中售價(jià)均為官方首發(fā)限價(jià)
我們可以看到GeForceGTX1080的默認(rèn)核心頻率達(dá)到了驚人的1607MHz,Boost頻率為1733MHz,顯存帶寬為320GB/s,這款產(chǎn)品完整支持DirectX12API以及異步運(yùn)算,在DX12中有著更好的表現(xiàn)。GTX1080的默認(rèn)PixelFillrate能力達(dá)到了102.8Gpiexls/S,默認(rèn)TextureFillrate能力為277.3Gtexels/S。憑借超高的基礎(chǔ)頻率和龐大的運(yùn)算規(guī)模,GTX1080擁有9TFLOPS的超高單精度浮點(diǎn)運(yùn)算能力,照比GTXTitanX提升了28%,甚至超越了R9FuryX的8.6TFLOPS單精度浮點(diǎn)運(yùn)算能力,成為目前單精度浮點(diǎn)運(yùn)算性能最高的游戲顯卡。
GP104架構(gòu)圖
Pascal架構(gòu)GP104-400芯片由以下主要的部分組成:
1、基于TSMC的16nmFinFET工藝。
2、4單元的宏觀并行結(jié)構(gòu),20組SMs單元被分為4個(gè)GPC,每個(gè)GPC包含5組SMs。
3、20組全新設(shè)計(jì)的,包含了幾何引擎、光柵化引擎以及線程仲裁管理機(jī)制的SMs單元。每個(gè)SMs單元包含一組負(fù)責(zé)處理幾何任務(wù)需求的PolyMorphEngine,同時(shí)均下轄5組更基本的SM單元,每個(gè)SMs單元包含8個(gè)負(fù)責(zé)處理材質(zhì)以及特種運(yùn)算任務(wù)如卷積、快速傅里葉變換等的TextureArray,四組并行的二級(jí)線程管理機(jī)制以及對(duì)應(yīng)的shared+UnifiedCache等緩沖體系。
4、GP104擁有8個(gè)32位顯存控制器,總計(jì)256位,每個(gè)32位顯存控制器包含8個(gè)ROPs單元和256KB二級(jí)緩存,共計(jì)64個(gè)ROPs單元和2M二級(jí)緩存。
5、改進(jìn)型的4.0版本PolyMorphEngine,包含了為VR設(shè)計(jì)的TheSimultaneousMulti-ProjectionEngine,在極端情況下,SMP引擎可以減少32倍VR所需的幾何渲染工作量。
GP104SM單元架構(gòu)圖
在GeForceGTX1080上,我們看到了其與上代基于Maxwell2.0架構(gòu)顯卡相類似的設(shè)計(jì),主要區(qū)別就是每個(gè)GPC中多了一組SMs單元。這就讓這款顯卡能夠支持所有在GeForceGTX900系列中的特性,以后使用到這款顯卡的玩家能夠獲得與其他采用基于Maxwell2.0架構(gòu)設(shè)計(jì)的顯卡的體驗(yàn)。