硬件層面,也就是所謂的硬件加速, CPU、GPU、FPGA、ASIC。CPU與GPU相比在大數據多任務處理上,肯定GPU更占優勢。FPGA與GPU相比,在兼顧了靈活性的基礎上,無論是計算能力和功耗性能上都要更強,缺點是性價比太低。ASIC是的,其他的硬件形態都是無法比擬的。
●在算法過程中頻繁的數據混洗使得NTT難以在計算集群中分布,無法并行計算,并且由于需要從大型數據集中加載和卸載數據,在硬件上運行時需要大量帶寬。即使硬件操作很快,這可能也會導致速度變慢。例如,如果硬件芯片的內存為16GB或更少,那么在100GB的數據集上運行NTT將需要通過網絡加載和卸載數據,這可能會大大降低操作速度。
芯片的硬件指的是運行指令的物理平臺,包括處理器、內存、存儲設備等等。芯片數據中常出現的“晶體管數量”、“7nm制程”、“存儲”等,往往指的就是硬件參數。
軟件則包括固件、驅動程序、操作系統、應用程序、算子、編譯器和開發工具、模型優化和部署工具、應用生態等等。這些軟件指導硬件如何響應用戶指令、處理數據和任務,同時通過特定的算法和策略優化硬件資源的使用。芯片數據中常出現的“x86指令集”、“深度學習算子”、“CUDA平臺”等,往往指的就是芯片軟件。
為了打破英偉達一家獨大的局面,前任全球芯片老大英特爾和多年老對手AMD對標CUDA都分別推出了OneAPI和ROCm,Linux基金會更是聯合英特爾、谷歌、高通、ARM、三星等公司聯合成立了民間號稱“反CUDA聯盟”的UXL基金會,以開發全新的開源軟件套件,讓AI開發者能夠在基金會成員的任何芯片上進行編程,試圖讓其取代CUDA,成為AI開發者的開發平臺。