在分析之前,我們先看一下ASIC(Application Specific Integrated Circuit),中文全稱是“專用集成電路”。這里特別強調“專用”,“專用”意味著針對單一項目來說會更加有競爭力。相對比,GPU(顯卡)是通用計算處理芯片,所以在單一項目上來說“專用”肯定比“通用”更有競爭力。
硬件層面,也就是所謂的硬件加速, CPU、GPU、FPGA、ASIC。CPU與GPU相比在大數據多任務處理上,肯定GPU更占優勢。FPGA與GPU相比,在兼顧了靈活性的基礎上,無論是計算能力和功耗性能上都要更強,缺點是性價比太低。ASIC是的,其他的硬件形態都是無法比擬的。
●在算法過程中頻繁的數據混洗使得NTT難以在計算集群中分布,無法并行計算,并且由于需要從大型數據集中加載和卸載數據,在硬件上運行時需要大量帶寬。即使硬件操作很快,這可能也會導致速度變慢。例如,如果硬件芯片的內存為16GB或更少,那么在100GB的數據集上運行NTT將需要通過網絡加載和卸載數據,這可能會大大降低操作速度。
早在2021年,英偉達就曾公開表示過“禁止使用轉換層在其他硬件平臺上運行基于CUDA的軟件”,2024年3月,英偉達更是將其升級為“CUDA禁令”,直接添加在了CUDA的終用戶許可協議中,已禁止用轉譯層在其他GPU上運行CUDA軟件