軟件層面,在語言層面上,ZK更友好的格式,也會(huì)帶來加速生成的過程,比如Aleo的Leo語言。再就是算法本身的優(yōu)化,雖然說有一定的優(yōu)化空間,但是要想有大的突破需要非常多的時(shí)間,畢竟?fàn)可娴胶芏鄶?shù)學(xué)問題。
硬件層面,也就是所謂的硬件加速, CPU、GPU、FPGA、ASIC。CPU與GPU相比在大數(shù)據(jù)多任務(wù)處理上,肯定GPU更占優(yōu)勢(shì)。FPGA與GPU相比,在兼顧了靈活性的基礎(chǔ)上,無論是計(jì)算能力和功耗性能上都要更強(qiáng),缺點(diǎn)是性價(jià)比太低。ASIC是的,其他的硬件形態(tài)都是無法比擬的。
●在算法過程中頻繁的數(shù)據(jù)混洗使得NTT難以在計(jì)算集群中分布,無法并行計(jì)算,并且由于需要從大型數(shù)據(jù)集中加載和卸載數(shù)據(jù),在硬件上運(yùn)行時(shí)需要大量帶寬。即使硬件操作很快,這可能也會(huì)導(dǎo)致速度變慢。例如,如果硬件芯片的內(nèi)存為16GB或更少,那么在100GB的數(shù)據(jù)集上運(yùn)行NTT將需要通過網(wǎng)絡(luò)加載和卸載數(shù)據(jù),這可能會(huì)大大降低操作速度。
早在2021年,英偉達(dá)就曾公開表示過“禁止使用轉(zhuǎn)換層在其他硬件平臺(tái)上運(yùn)行基于CUDA的軟件”,2024年3月,英偉達(dá)更是將其升級(jí)為“CUDA禁令”,直接添加在了CUDA的終用戶許可協(xié)議中,已禁止用轉(zhuǎn)譯層在其他GPU上運(yùn)行CUDA軟件