為什么GPU每一代的更新性能上都有「重大突破」?
首先,我們不能被手機SOC吹上天的7nm、5nm、3nm帶跑偏了。柵極寬度代表的工藝制程nm數并不能代表一切。
舉個例子:
臺積電的7nm和英特爾的10nm名義上差一代,實際上半斤八兩。英特爾10nm一個單位占面積54*44nm,每平方毫米1.008億個晶體管;而臺積電7nm一個單位占面積57*40nm,每平方毫米1.0123億個晶體管。兩者并沒有代差。
芯片的性能要從晶體管密度、柵極間距、最小金屬間距、鰭片高度、柵極長度等指標來看。
CPU并不是一成不變它也一直在突破1、高性能計算領域
比如英特爾的AVX-512是一組能夠針對各種工作負載和用途(例如科學模擬、金融分析、人工智能 (AI)/深度學習、3D 建模與分析、圖像和音頻/視頻處理、加密及數據壓縮)提高性能的新指令。
借助多達兩個512位融合乘加 (FMA) 單元,應用程序在512位矢量內的每個時鐘周期可打包32次雙精度和64次單精度浮點運算,以及八個64位和十六個32位整數。
2、云服務和數據中心
英特爾為云服務提供了從底層硬件到系統軟件虛擬化的全套支持,而CPU性能的進步,單芯片核心數提升,功耗降低,讓云服務得以爆炸式的增長,虛擬化技術讓云服務使用更加便捷安全。
3、個人應用
英特爾的6核本來是打算用在10nm桌面平臺,被AMD逼得提前獻祭出來。有市場競爭的關系,但架構改進,功耗控制等確實比以前好了。
另外,看看現在的筆記本續航和性能,還覺得擠牙膏只能說要求過高了。
GPU的“重大突破”1、GPU的“重大突破”一部分要歸功于工藝制程的提升
集成電路一直都是根據摩爾定律發展,每2年左右晶體管數量翻倍。顯卡架構本身并行擴展性非常好,GPU的流處理器個數成倍的增長,就會出現所謂的“重大突破”。其實這是制程工藝升級換代的必然結果。
隨著工藝制程的提升,CPU也在突破。比如:每代志強CPU核心數量平均提升30%,性能至少提升50%。
所以這個重大突破的頭銜,送給芯片代工廠家更合適。
2、GPU的“重大突破”一部分要歸功于架構的調整
舉個例子:
NVIDIA的CUDA演進了這么多年了,SMX/SMM數目組合不斷調整提高效率,SM內部的CUDA核心的單雙精度浮點計算配比、寄存器緩存大小、存取單元個數、指令緩沖區大小、 warp調度器重新設計等一直在變,并且是面向應用的要求而變,迎合市場需求,顯得很受歡迎。
Maxwell架構閹割雙精度單元,大幅降低功耗,讓單精度性能大幅提升,改進SM效率變高,實現制程不變功耗降低,單精度性能提升的壯舉!(游戲主要看單精度浮點計算性能)Pascal架構制程從上一代的28nm躍遷到16nm,相當于一次跨越了兩代制程工藝,再加上架構繼續改進,緩存變大,新的工藝使得功耗大大降低,頻率拉高,上一代閹割的雙精度單元也加回來了,從而實現了性能重大突破。3、GPU的“重大突破”一部分歸功于深度學習
在深度學習領域,顯卡的加入可以說是重大突破,舉個例子:
Pascal架構的GPU支持半精度計算,性能是單精度的兩倍(CPU沒有半精度就不能讓性能提升2倍)。而新的Volta架構,專門加入Tensor Core單元用于深度學習矩陣乘加(Tensor Core單元不能直接用于傳統圖形應用)。
GPU在設計時,會對其使用場景就進行了一次細分,這種專門設計的單元,性能自然比通用處理器來的猛。相較于之前沒有這類處理單元,也可說這是重大突破。
綜上所述,GPU確實是每一代更新都有所謂的“重大突破”,CPU在功耗控制、新指令集退出、服務器堆核等方面也從來沒有擠過牙膏。調侃一下就好,不能真信了。以上個人淺見,歡迎批評指正。
認同我的看法,請點個贊再走,感謝!
喜歡我的,請關注我,再次感謝!