AgentCPM-Explore 正式開源，業內首個 4B 參數量的端側智能體模型

清華大學自然語言處理實驗室、中國人民大學、面壁智能與 OpenBMB 社區正式開源了業內首個 4B 參數量的端側智能體模型 AgentCPM-Explore。據稱在 GAIA、HLE、BrowserComp 等 8 個主流長程智能體評測中全面突破，不僅拿下同尺寸 SOTA，更越級媲美 8B 模型，甚至比肩部分 30B+ 模型。支持 100+ 輪穩定交互，具備質疑、求真、變通、執着的“類人”探索能力。

AgentCPM-Explore 核心亮點一覽

打破參數壁壘：首個具備 GAIA、Xbench、Browsercomp 等 8 個長難智能體任務處理能力的 4B 端側模型，重新定義小模型性能天花板；
長程深度探索：最高可實現超過 100 輪不重複且穩定的環境交互，持續深度探索直至任務準確完成；
全流程開源：在開源模型的基礎上進一步開源配套的工具沙盒統一管理調度平台 AgentDock、全異步強化學習訓練框架 AgentRL、智能體能力一鍵式測評平台 AgentToLeaP，支持社區全流程復現與自定義擴展。

此次開源包含模型權重、模型的 RL 訓練框架、評測系統以及工具調度平台。

Github：https://github.com/OpenBMB/AgentCPM
HuggingFace：https://huggingface.co/openbmb/AgentCPM-Explore
ModelScope：https://modelscope.cn/models/OpenBMB/AgentCPM-Explore
魔樂社區：https://modelers.cn/models/OpenBMB/AgentCPM-Explore

發佈評論

Product

Company

Support

Company

AgentCPM-Explore 正式開源，業內首個 4B 參數量的端側智能體模型

發佈 評論

發佈評論