2025年4月29日凌晨,阿里巴巴正式發佈新一代大語言模型 Qwen3,以“混合推理”為核心,在性能、成本、靈活性三大維度實現跨越式突破。
贊奇也立刻着手使用8卡 H20 141GB 進行本地化部署,預計在五一節後發佈Qwen3的併發測試報告,看看其實際應用體驗究竟如何。
關注並私信即可優先獲取測試報告!
Qwen3模型介紹:
Qwen3-235B-A22B 是一個大型模型,總參數量達2350 億,激活參數量達 220 億。
Qwen3-30B-A3B 是一個較小的 MoE 模型,總參數量達 300 億,激活參數量達 30 億。
Qwen3模型特點:
- 混合思維模式
1.思考模式:在此模式下,模型需要逐步推理,最終給出答案。這對於需要深入思考的複雜問題非常理想。
2.非思考模式:在此模式中,模型提供快速、近乎即時的響應,適用於速度比深度更重要的簡單問題。
這説明 Qwen3 既能在簡單問題上快思考,秒出答案;又能在複雜問題上慢思考,展開多步推理和深入分析。
- 多語言支持
Qwen3 模型支持119 種語言和方言。這種廣泛的多語言能力為國際應用開闢了新的可能性,使全球用户都能受益於這些模型的強大功能。
- 增強代理能力
本次 Qwen3 的更新,還體現在了 Agent 和代碼能力,同時也加強了對 MCP 的支持。
值得一提的是,Qwen3 有一個配套的 Qwen-Agent 項目,可以方便地使用 API 進行工具調用,或結合現有的工具鏈進行擴展。
更多參考資料:
GitHub:
https://github.com/QwenLM/Qwen3
Hugging Face:
https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e...
ModelScope:
https://modelscope.cn/collections/Qwen3-9743180bdc6b48