根據斯坦福大學人本中心人工智能研究所的最新分析,多箇中國機構現已推出最先進的人工智能模型,並在全球分發和應用方面超越了美國競爭對手。
早在2025年初,隨着 Deepseek 公司發佈 R1模型,全球的目光就聚焦於這家中國初創企業。然而,研究人員指出,中國的開放權重 AI 生態系統遠比人們想象的要龐大和複雜。
研究顯示,阿里巴巴的 Qwen 模型家族在2025年9月時,已取代 Meta 的 Llama,成為 Hugging Face 平台上下載量最高的語言模型家族。在2024年8月至2025年8月間,中國開發者的下載量佔17.1%,略高於美國的15.8%。更值得注意的是,63% 的新精調模型基於中國的基礎模型。
斯坦福研究人員強調,Deepseek 並不是唯一重要的參與者,除了這家位於杭州的初創企業,還有多箇中國組織在公開發布高性能模型。這些組織包括知名科技巨頭阿里巴巴、騰訊、百度、華為和字節跳動等。
由於美國自2022年10月起限制對最強大 AI 芯片的出口,中國開發者在技術上逐漸轉向更高效的開放權重模型。同時,這些模型的許可條款也越來越寬鬆,允許幾乎無限制的使用和修改。
在全球範圍內,越來越多的國家和企業開始採用中國的開放權重模型。新加坡的國家 AI 計劃正在以阿里巴巴的 Qwen 模型為基礎構建其旗艦模型,而美國公司 Meta 則收購了一家使用中國開放權重模型的初創企業。
不過,研究人員也指出,安全問題不容忽視。美國政府的測試顯示,Deepseek 模型在面臨攻擊時的脆弱性是同類美國模型的十二倍。雖然中國政府對開放 AI 開發的支持並不確定,但其在國際上一直倡導技術平等發展。