如何看待英偉達發布的RTX20系列顯卡?
從GTX 9系到GTX 10系演進,英偉達將GPU圖形性能做了一次超大幅度的突破,可謂是震驚世人。而從GTX 10系到RTX 20系,這種性能飛躍仍在繼續,但更多的則是來自三大功能方面的提升:
其一,引入RTX(Real Time Ray Tracing),即光線追蹤技術。
其二,引入DLSS(Deep Learning Super Sampling),即深度學習超采樣技術。
其三,引入NAS(NVIDIA Adaptive Shading),即高級著色技術。
雖然目前從游戲、應用端來看,對于三大技術的支持還沒有全面鋪開,但從現有的資源就可以看出,這三大技術對于未來圖形計算有著非常重大的影響。
·移動版RTX 20顯卡參數過硬
去年8月,英偉達發布了桌面級RTX 20系圖形顯卡,引發業界廣泛關注。而在今年初的CES上,英偉達又公布了移動級RTX 20系顯卡,至此,游戲筆記本將正式從GTX 10系過渡到RTX 20系獨顯的新世代。那么RTX 20系獨立顯卡將為游戲本帶來怎樣的性能提升呢?
在本次CES發布會上,英偉達展示了包括搭載RTX 2080獨立顯卡的微星GS65 Stealth以及技嘉Aero系列游戲新品,同時還展示了搭載RTX 2060的宏碁掠奪者Helios 500游戲本新品,根據官方介紹,移動級RTX 2060獨立顯卡能夠提供優于桌面版GTX1070的性能,而移動版RTX2080顯卡的性能已經大幅超越了GTX 1080獨顯的性能表現。
之所以能夠在圖形性能上大幅超越上代同級或更高一級的顯卡,主要原因在于RTX 20系顯卡的基本規格都進行普遍性的大幅度提升。以最新發布的RTX 2060顯卡為例,其基于12nm制程圖靈架構設計,CUDA流處理器達到1920個,與上一代GTX 1070獨顯的流處理器個數相當。同時還擁有6GB容量GDDR6顯存,192bit顯存位寬,并且支持實時光線追蹤、NAS著色技術、DLSS深度學習超采樣等新技術。
從硬性參數來看,全新的RTX 20系移動級顯卡能夠為游戲本帶來更為強悍的圖形性能輸出,為玩家帶來流暢的游戲畫面體驗。
·底層架構優化助力性能潛力爆發
除了硬性的參數指標之外,RTX 20系顯卡之所以性能發揮更為穩定和出色,與優化后的圖靈架構密切相關。對于半導體芯片來說,參數是流于表面的性能指標,但是底層架構才是實現性能優化、提升、甚至爆發的根基,英偉達為RTX 20系顯卡賦予的圖靈架構正是為此而生。
圖靈(Turing)架構示意圖(TU102核心)
此次RTX 20系顯卡全面使用了圖靈(Turing)架構,上圖為TU102核心。我們可以看到完整的TU102核心由6組GPC組成,每組GPC包含6組TPC,不同于GTX 10系顯卡的Pascal架構每組TPC僅有一組SM的設計,Turing架構每組TPC包含2組SM單元,所以一個GPC就包含12組SM單元,整個TU102核心一共有72組SM單元。
SM單元架構圖
我們再來簡單剖析一下圖靈架構的SM單元??梢钥吹?,Turing架構的SM單元中已經沒有了我們所熟悉的排列整齊的CUDA,而是變成了主要由64個INT32+64個FP32+8個Tensor Cores+1個RT Core組成的集合,同時添加了獨立的INT數據路徑,類似于Volta GV100 GPU的獨立線程調度,支持FP32和INT32操作的并發執行。而Tensor Cores和RT Core則分別針對深度學習和實時光線追蹤進行加速。
需要注意的是,示例中的桌面級RTX 2080 Ti并非是完整版的TU102核心,其在SM單元上閹割了四組,由72組SM砍為68組,由此組成68×64=4352個CUDA單元、68×8=544個Tensor Cores以及68×1=68個RT Cores。
因此,正是有強大的底層架構支持,才能讓RTX 20系顯卡在性能發揮上更加游刃有余。
·光線追蹤將對游戲畫面表現力產生深遠影響
最后我們再說說RTX光線追蹤技術,因為它將對游戲畫面表現力產生深遠影響。
RTX,全稱Ray Tracing,光線追蹤技術。是一種先進的實時光線渲染算法,與微軟在DX12 API子集中力推的DXR技術站在相似的發展路線上,可以通過將光線擴展到整個場景中計算的方式打造出更加真實的環境,彌補了光柵化渲染的很多固有缺憾。
RTX關閉和開啟后的光影差異
為什么現代的游戲擁有足以比擬真實世界的貼圖材質,卻依然帶給我們假的感覺?其原因之一就是光線處理方法不自然。現在的游戲處理光線的方法是點光源通過物體反射到玩家的畫面中,而那些復雜的光線反射和折射則通過預先處理好的“假”陰影等進行預加載,那么我們在玩游戲時只需要計算那些沒有預加載的光線部分即可,效率很高但是很假。電影建模之所以有真實的視覺感受就是因為所有場景都是預渲染出來的,不需要在游戲中實時渲染。
RTX工作原理示意(注意光線箭頭方向)
實時光線追蹤技術的原理是反推光線進程,以玩家的顯示器為出發點(相當于一臺攝像機),通過計算光線從顯示器經過樹葉,玻璃等的反射再到光源這一系列產生的效應,把陰影細節等部分加以保留,真正的做到了實時渲染且不卡頓。而這一切則是通過本次全新的圖靈架構中的RT核心做到的。
·移動版/桌面版圖形顯卡性能越來越無差異化
其實從GTX 10系開始我們就已經注意到,桌面級獨顯與移動級獨顯的性能差距已經幾乎被抹平,這與GTX 9系之前桌面級與移動級涇渭分明的性能表現有著天壤之別。之所以能夠達成這樣的局面,很大程度上是來自制程工藝技術的進步,芯片體積縮小、性能增強的情況下,使得圖形顯卡完全沒有必要從性能層面上再去區分桌面級與移動級,因而在RTX 20系圖形顯卡全面落地之后,延續了這種桌面與移動級的無差異化表現。
對于這一代顯卡來說,桌面級獨顯的價格成本上升不少,使得一部分用戶望而卻步,而移動版的發布則給了用戶一個體驗RTX 20系獨顯性能的最佳途徑。同時,RTX 20系移動級獨顯也將為游戲本圖形性能進化加上一枚助推器。