芯片的硬件指的是運行指令的物理平臺,包括處理器、內(nèi)存、存儲設備等等。芯片數(shù)據(jù)中常出現(xiàn)的“晶體管數(shù)量”、“7nm制程”、“存儲”等,往往指的就是硬件參數(shù)。
軟件則包括固件、驅(qū)動程序、操作系統(tǒng)、應用程序、算子、編譯器和開發(fā)工具、模型優(yōu)化和部署工具、應用生態(tài)等等。這些軟件指導硬件如何響應用戶指令、處理數(shù)據(jù)和任務,同時通過特定的算法和策略優(yōu)化硬件資源的使用。芯片數(shù)據(jù)中常出現(xiàn)的“x86指令集”、“深度學習算子”、“CUDA平臺”等,往往指的就是芯片軟件。
在分析之前,我們先看一下ASIC(Application Specific Integrated Circuit),中文全稱是“專用集成電路”。這里特別強調(diào)“專用”,“專用”意味著針對單一項目來說會更加有競爭力。相對比,GPU(顯卡)是通用計算處理芯片,所以在單一項目上來說“專用”肯定比“通用”更有競爭力。
為了打破英偉達一家獨大的局面,前任全球芯片老大英特爾和多年老對手AMD對標CUDA都分別推出了OneAPI和ROCm,Linux基金會更是聯(lián)合英特爾、谷歌、高通、ARM、三星等公司聯(lián)合成立了民間號稱“反CUDA聯(lián)盟”的UXL基金會,以開發(fā)全新的開源軟件套件,讓AI開發(fā)者能夠在基金會成員的任何芯片上進行編程,試圖讓其取代CUDA,成為AI開發(fā)者的開發(fā)平臺。
早在2021年,英偉達就曾公開表示過“禁止使用轉換層在其他硬件平臺上運行基于CUDA的軟件”,2024年3月,英偉達更是將其升級為“CUDA禁令”,直接添加在了CUDA的終用戶許可協(xié)議中,已禁止用轉譯層在其他GPU上運行CUDA軟件