國產AI晶片上的圖優化編譯技術研究——以昇騰CANN為例

作者

  • 周 映竹 大連理工大學,遼寧 大連,116024

DOI:

https://doi.org/10.53104/xdkxts.2025.01.02.005

關鍵詞:

昇騰CANN;圖優化編譯;能效建模;運算元融合;NPU架構;國產AI晶片

摘要

國產AI晶片的規模越來越大,模型結構也越來越複雜。編譯系統在晶片性能和能效優化中起著重要作用。國產AI晶片在硬體設計上已經有了明顯的進步,但性能提升仍受到編譯優化的限制。本文以昇騰CANN編譯體系為例,研究圖優化編譯在能效提升和軟硬體配合中的原理和方法。

研究從計算圖結構和編譯理論出發,分析圖優化在運算元融合、圖結構調整和記憶體管理中的作用。圖優化能在演算法和硬體之間建立一種對應關係,使計算更高效。通過分析昇騰CANN的體系結構,可以看到它的優化重點是以圖為核心的資源配置策略。它通過運算元融合和資料流程調整,讓執行速度更快,能耗更低。

研究構建了一個多目標約束的能效優化模型,把計算代價、頻寬使用和功率消耗放在同一個分析框架中。這樣可以讓圖優化過程更有規律,也能更好地平衡性能和能耗。

在比較研究中,本文對CANN、TensorRT、TVM和NeuWare等系統進行了分析。結果顯示,國產編譯系統更注重硬體特徵和能效優化,而國外框架更重視通用性和跨平臺相容性。這種不同說明國產編譯系統處於以性能為主要目標的階段,並在逐步提升開放性。

研究還提出了未來圖優化的發展方向,包括自動優化機制、跨晶片統一編譯框架,以及以能效為重點的自我調整編譯系統。圖優化編譯是提升AI晶片算力利用率的重要環節,也是推動國產AI算力自主化的關鍵技術。通過更完善和智慧的編譯系統建設,可以在能效、性能和生態相容性之間實現新的平衡。

已出版

2026-01-14

期次

欄目

Articles