●在算法過(guò)程中頻繁的數(shù)據(jù)混洗使得NTT難以在計(jì)算集群中分布,無(wú)法并行計(jì)算,并且由于需要從大型數(shù)據(jù)集中加載和卸載數(shù)據(jù),在硬件上運(yùn)行時(shí)需要大量帶寬。即使硬件操作很快,這可能也會(huì)導(dǎo)致速度變慢。例如,如果硬件芯片的內(nèi)存為16GB或更少,那么在100GB的數(shù)據(jù)集上運(yùn)行NTT將需要通過(guò)網(wǎng)絡(luò)加載和卸載數(shù)據(jù),這可能會(huì)大大降低操作速度。
按照官方的設(shè)想和規(guī)劃未來(lái)在Aleo上每天的交易量都是上億美金的規(guī)模,在這樣大數(shù)據(jù)量的要求下,每時(shí)每刻都有證明需要被委托出去在極短的時(shí)間內(nèi)完成證明的生產(chǎn),不可能指望顯卡能解決這個(gè)問(wèn)題。就像AI大模型訓(xùn)練一樣,早期數(shù)據(jù)量和參數(shù)少的情況下可以用消費(fèi)級(jí)顯卡,但是現(xiàn)在更多的都是為AI訓(xùn)練設(shè)計(jì)的專(zhuān)用芯片和機(jī)器。
芯片的硬件指的是運(yùn)行指令的物理平臺(tái),包括處理器、內(nèi)存、存儲(chǔ)設(shè)備等等。芯片數(shù)據(jù)中常出現(xiàn)的“晶體管數(shù)量”、“7nm制程”、“存儲(chǔ)”等,往往指的就是硬件參數(shù)。
軟件則包括固件、驅(qū)動(dòng)程序、操作系統(tǒng)、應(yīng)用程序、算子、編譯器和開(kāi)發(fā)工具、模型優(yōu)化和部署工具、應(yīng)用生態(tài)等等。這些軟件指導(dǎo)硬件如何響應(yīng)用戶指令、處理數(shù)據(jù)和任務(wù),同時(shí)通過(guò)特定的算法和策略?xún)?yōu)化硬件資源的使用。芯片數(shù)據(jù)中常出現(xiàn)的“x86指令集”、“深度學(xué)習(xí)算子”、“CUDA平臺(tái)”等,往往指的就是芯片軟件。
為了打破英偉達(dá)一家獨(dú)大的局面,前任全球芯片老大英特爾和多年老對(duì)手AMD對(duì)標(biāo)CUDA都分別推出了OneAPI和ROCm,Linux基金會(huì)更是聯(lián)合英特爾、谷歌、高通、ARM、三星等公司聯(lián)合成立了民間號(hào)稱(chēng)“反CUDA聯(lián)盟”的UXL基金會(huì),以開(kāi)發(fā)全新的開(kāi)源軟件套件,讓AI開(kāi)發(fā)者能夠在基金會(huì)成員的任何芯片上進(jìn)行編程,試圖讓其取代CUDA,成為AI開(kāi)發(fā)者的開(kāi)發(fā)平臺(tái)。