星辰語義大模型 TeleChat3 正式開源,完全基於國產算力訓練

新聞
HongKong
3
11:05 AM · Jan 05 ,2026

中國電信人工智能研究院(TeleAI)開源了星辰語義大模型 TeleChat3 系列,包含國內首個全國產化訓練的千億參數細粒度 MoE 模型 TeleChat3-105B-A4.7B-Thinking 以及稠密架構模型 TeleChat3-36B-Thinking。

據介紹,該系列模型完全基於國產算力(上海臨港國產萬卡算力池)訓練,基礎數據量達 15T tokens。TeleChat3 全系支持 Thinking 思考模式,通過在 chat template 中加入特定引導符號生成推理過程,在知識、數學、創作、代碼、Agent 及指令遵循等 六 個維度均比肩業內頭部模型。

目前,該系列模型已實現對昇騰 Atlas 800T A2 訓練服務器及昇思 MindSpore 框架的深度適配,相關資源已在 GitHub 和 ModelScope 上線。

開源地址:https://github.com/Tele-AI/TeleChat3

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.