DiffusionDrive引入了一種用於端到端自動駕駛的截斷擴散模型,通過解決計算開銷和模式崩潰問題,實現了實時多模態軌跡生成。該系統在NAVSIM數據集上創造了新的性能記錄,以45 FPS達到88.1 PDMS,同時生成多樣化且合理的駕駛動作。 引言 DiffusionDrive 引入了一種通過將擴散模型應用於端到端軌跡規劃來解決自動駕駛
1 模型架構描述 Diffusion-TS的模型結構始於將時間序列數據輸入一個基於Transformer的編碼器進行編碼,以獲得其全局的向量表示。解碼器隨後對這些表示進行解碼,其輸出通過一個權重矩陣進行映射後分流:一部分送入趨勢合成層,另一部分進入傅里葉合成層。輸入全連接神經網絡(FFN)的部分經處理後,對已經過自注意力機制和交叉注意力機制處理的時