AI加速器架構設計與實現
這是一本講解NPU硬件架構設計與技術實現的著作。作者將自己在CPU、GPU和NPU領域15年的軟硬件工作經驗融會貫通,將四代NPU架構設計經驗融為一體,將端側和云側NPU架構合二為一,總結并提煉出本書內容。本書主要討論神經網絡硬件層面,尤其是芯片設計層面的內容,主要包含神經網絡的分析、神經網絡加速器的設計以及具體實現技術。通過閱讀本書,讀者可以深入了解主流的神經網絡結構,掌握如何從零開始設計一個能用、好用的產品級加速器。通過閱讀本書,你將:透徹理解與深度學習相關的機器學習算法及其實現;學會主流圖像處理領域神經網絡的結構;掌握加速器運算子系統和存儲子系統的設計;摸清加速器設計中遇到的具體問題及其解決方法;了解NPU架構需要考慮的控制通路和數據通路。
·6萬字