【美團發新兆級AI模型】LongCat-2.0全程用國產晶片練成 5萬張晶片集群跑萬億參數 挑戰美系晶片主導格局
美團正式發布新一代大型語言模型 LongCat-2.0,總參數規模達 1.6 兆,並已在 Hugging Face 上架技術文件。據美團介紹,LongCat-2.0 是業界首個完全在 5 萬張國產算力晶片組成的集群上,完成訓練及運行全流程的兆級參數人工智能系統,未有動用外國晶片。這項宣稱若獲得市場及技術界廣泛認可,將被視為中國自主算力發展的重要指標。
【規格拆解】1.6兆參數 混合專家架構
LongCat-2.0 採用混合專家(MoE)架構,總參數規模約 1.6 兆,每個 token 平均啟用約 480 億個參數,動態範圍介乎 330 億至 560 億之間。模型由零開始訓練,預訓練數據規模超過 30 兆 token,涵蓋中文、英文、多語言及程式碼等多類數據,並原生支援 100 萬 token 的超長上下文視窗。公開資料顯示,訓練過程歷時數月,並未出現需要回滾的中斷,反映訓練穩定性達到一定水平。目前模型技術文件已於 Hugging Face 上架,惟具體模型權重截至發布當日仍未開放下載。
【國產晶片】5萬張集群完成全流程 未點名供應商
外界最關注的,是美團今次強調「全程」使用國產晶片。消息指,LongCat-2.0 的預訓練在超過 5 萬張中國國產算力晶片組成的集群上完成,訓練與推理均在同一套國產硬件上運行,並運用相關通訊協議技術協調晶片之間的運算。這與此前部分同業模型的做法不同——業界此前已有先例以國產晶片承擔推理工作,但預訓練階段仍依賴外國晶片;今次美團宣稱連運算量最龐大的預訓練階段亦全部由國產晶片完成。惟具體晶片供應商及型號,美團官方未有公開點名,公開資料亦未見第三方獨立覆核相關產能數字,此點值得留意。
| 項目 | 內容 | 洞察 |
| 總參數規模 | 約1.6兆,每token啟用約480億 | 屬全球頭部規模 |
| 訓練硬件 | 5萬張國產晶片集群,據稱全流程 | 晶片供應商未公開 |
| 訓練數據量 | 逾30兆token,原生支援100萬token上下文 | 規模對標一線模型 |
| 開源進度 | 技術文件已上架,權重未公開 | 「開源」仍待完整兌現 |
【性能比拼】部分測試逼近國際主流模型
美團方面披露的內部評測顯示,LongCat-2.0 在部分編碼及智能代理相關基準測試中,表現逼近甚至超越國際主流閉源模型;但在部分代理任務測試上,仍落後於個別國際頂尖模型。值得留意的是,上述評測數據由美團自行公布,暫未見獨立第三方機構完成覆核驗證,實際表現有待市場及開發者進一步檢驗。另有報道指出,該模型早於今年 4 月底已以匿名身份在海外開發者平台上線測試,累積調用量一度躋身全球前列,直至今次正式發布才確認身份,反映其實際性能此前已獲部分開發者社群認可。
【產業意義】自主算力敘事再添一例
美團今次高調強調「全程國產晶片」,被視為呼應近年外國晶片出口限制背景下,中國科技企業探索自主算力路線的最新案例。此前已有同業以國產晶片承擔模型推理工作,但將運算需求更高的預訓練階段亦全數轉移至國產硬件,仍屬業界較新嘗試。若相關產能及穩定性數字屬實,將為市場提供多一個「去英偉達化」訓練路徑的參考案例;惟目前公開資料未見美團就此發布獨立股價或營運指標變化,具體對公司財務及業務層面的影響,仍需視乎後續官方披露及市場反應而定。
美團這次發布,展示的是一條國產算力由「輔助角色」走向「挑大樑」的可能路徑,但晶片供應商未點名、模型權重未完全開放、獨立評測仍缺席,都是外界審視這項宣稱時無法迴避的空白。國產算力能否持續支撐更大規模、更前沿的模型訓練,最終仍需時間及更多獨立數據驗證。
免責聲明:本專頁刊載的所有投資分析技巧,只可作參考用途。市場瞬息萬變,讀者在作出投資決定前理應審慎,並主動掌握市場最新狀況。若不幸招致任何損失,概與本刊及相關作者無關。而本集團旗下網站或社交平台的網誌內容及觀點,僅屬筆者個人意見,與新傳媒立場無關。本集團旗下網站對因上述人士張貼之資訊內容所帶來之損失或損害概不負責。
—

