Catlass 核心架構指南:問題驅動的設計 前言 在昇騰平台上寫高性能算子,從來不是一件輕鬆的事。手動管理多級內存、自己編排流水線、為不同 Shape 重寫 Kernel——這些痛點幾乎伴隨所有 Ascend C 開發者。但隨着 Catlass 的出現,情況開始徹底改變。 Catlass 通過一套高度模塊化、