清華大學自然語言處理實驗室、中國人民大學、面壁智能與 OpenBMB 社區正式開源了業內首個 4B 參數量的端側智能體模型 AgentCPM-Explore。據稱在 GAIA、HLE、BrowserComp 等 8 個主流長程智能體評測中全面突破,不僅拿下同尺寸 SOTA,更越級媲美 8B 模型,甚至比肩部分 30B+ 模型。支持 100+ 輪穩定交互,具備質疑、求真、變通、執着的“類人”探索能力。
AgentCPM-Explore 核心亮點一覽
-
打破參數壁壘:首個具備 GAIA、Xbench、Browsercomp 等 8 個長難智能體任務處理能力的 4B 端側模型,重新定義小模型性能天花板;
-
長程深度探索:最高可實現超過 100 輪不重複且穩定的環境交互,持續深度探索直至任務準確完成;
-
全流程開源:在開源模型的基礎上進一步開源配套的工具沙盒統一管理調度平台 AgentDock、全異步強化學習訓練框架 AgentRL、智能體能力一鍵式測評平台 AgentToLeaP,支持社區全流程復現與自定義擴展。
此次開源包含模型權重、模型的 RL 訓練框架、評測系統以及工具調度平台。
Github:https://github.com/OpenBMB/AgentCPM
HuggingFace:https://huggingface.co/openbmb/AgentCPM-Explore
ModelScope:https://modelscope.cn/models/OpenBMB/AgentCPM-Explore
魔樂社區:https://modelers.cn/models/OpenBMB/AgentCPM-Explore