千尋智能 Spirit v1.5 登頂 RoboChallenge,同步開源

新聞
HongKong
0
02:51 PM · Jan 13 ,2026

千尋智能 Spirit v1.5 在具身智能模型評測平台 RoooChallenge 最新榜單中取得了世界第一的排名,成功超越 Pi 0.5。

目前,Spiritv1.5 模型權重、部分公開的微調任務權重以及推理與部署示例內容已實現開源,後續內容則將分階段持續更新。Spiritv1.5是一個面向真實世界任務的端到端具身智能基礎模型,致力於在單一模型框架內統一完成:

  • 泛化性:強大的跨任務與跨本體泛化能力
  • 穩定性:面向真實場景的連續任務能力
  • 準確性:對操作目標與執行結果的穩定精確控制

在模型架構上,Spirit v1.5採用Vision-Language-Action(VLA)統一建模框架,將視覺感知、語言理解與動作生成整合在同一決策流程中,減少多模塊串聯帶來的信息損耗,並提升長程任務中的整體穩定性。

在訓練方法上,Spirit v1.5的一個核心特點是不依賴高度精選的“乾淨”演示數據。千尋智能在技術博客中提出,過度腳本化、受控環境下采集的數據,雖然有利於模型快速收斂,但會限制其在真實世界中的泛化能力。

因此,Spirit v1.5在預訓練階段引入了開放式、多樣化的數據採集範式。數據採集不再嚴格限定任務腳本,而是以“完成有意義目標”為導向,允許操作過程中自然串聯多個子任務與原子技能。這種方式使模型在訓練階段接觸到更接近真實世界的複雜性,包括遮擋、失敗恢復以及任務之間的自然過渡。

相關消融實驗顯示,在相同數據規模下,基於多樣化數據預訓練的模型,在新任務上的遷移效率明顯高於基於傳統演示數據訓練的模型,達到相同性能所需的計算資源顯著減少。這一結果也解釋了Spirit v1.5在RoboChallenge多構型、未見任務評測中的穩定表現。

根據介紹,RoboChallenge是2025年新成立的標準化評測體系,由Dexmal、Hugging Face等機構聯合發起,聚焦具身智能模型的跨平台能力驗證。作為當前具身智能領域強調真實機器人執行能力的重要benchmark,其評測任務覆蓋複雜指令理解、多步驟操作規劃以及跨場景執行穩定性等多個維度。 

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.