千尋智能 Spirit v1.5 登頂 RoboChallenge，同步開源

千尋智能 Spirit v1.5 在具身智能模型評測平台 RoooChallenge 最新榜單中取得了世界第一的排名，成功超越 Pi 0.5。

目前，Spiritv1.5 模型權重、部分公開的微調任務權重以及推理與部署示例內容已實現開源，後續內容則將分階段持續更新。Spiritv1.5是一個面向真實世界任務的端到端具身智能基礎模型，致力於在單一模型框架內統一完成：

泛化性：強大的跨任務與跨本體泛化能力
穩定性：面向真實場景的連續任務能力
準確性：對操作目標與執行結果的穩定精確控制

在模型架構上，Spirit v1.5採用Vision-Language-Action（VLA）統一建模框架，將視覺感知、語言理解與動作生成整合在同一決策流程中，減少多模塊串聯帶來的信息損耗，並提升長程任務中的整體穩定性。

在訓練方法上，Spirit v1.5的一個核心特點是不依賴高度精選的“乾淨”演示數據。千尋智能在技術博客中提出，過度腳本化、受控環境下采集的數據，雖然有利於模型快速收斂，但會限制其在真實世界中的泛化能力。

因此，Spirit v1.5在預訓練階段引入了開放式、多樣化的數據採集範式。數據採集不再嚴格限定任務腳本，而是以“完成有意義目標”為導向，允許操作過程中自然串聯多個子任務與原子技能。這種方式使模型在訓練階段接觸到更接近真實世界的複雜性，包括遮擋、失敗恢復以及任務之間的自然過渡。

相關消融實驗顯示，在相同數據規模下，基於多樣化數據預訓練的模型，在新任務上的遷移效率明顯高於基於傳統演示數據訓練的模型，達到相同性能所需的計算資源顯著減少。這一結果也解釋了Spirit v1.5在RoboChallenge多構型、未見任務評測中的穩定表現。

根據介紹，RoboChallenge是2025年新成立的標準化評測體系，由Dexmal、Hugging Face等機構聯合發起，聚焦具身智能模型的跨平台能力驗證。作為當前具身智能領域強調真實機器人執行能力的重要benchmark，其評測任務覆蓋複雜指令理解、多步驟操作規劃以及跨場景執行穩定性等多個維度。

發佈評論

Product

Company

Support

Company

千尋智能 Spirit v1.5 登頂 RoboChallenge，同步開源

發佈 評論

發佈評論