螞蟻集團(Ant Group)近期發表研究,顯示其 AI 模型訓練成本可降低 20%,並成功使用國產半導體取代部分輝達(Nvidia)晶片。此舉突顯中國 AI 技術自主發展的進展,並在美國對華高端晶片管制下探索新路徑。
採用自製晶片,降低 AI 訓練成本
彭博社引用知情人士的消息報導稱,螞蟻集團利用中國製造的晶片,包括阿里巴巴和華為技術提供的硬體,來訓練其 AI 模型,並採用了「專家混合」(Mixture of Experts, MoE)機器學習技術,獲得與英偉達 H800 晶片相當的成果,並且降低了 20% 的 AI 模型訓練成本。
報導指出,儘管螞蟻集團仍在使用輝達的晶片進行 AI 開發,但現在更依賴 AMD 及國產半導體作為替代方案,以降低對美國進口晶片的依賴。數據顯示,使用高性能硬體訓練 1 兆個 token 需約 635 萬人民幣(約 88 萬美元),但透過優化技術,該成本可降至 510 萬人民幣(約 70 萬美元)。
這項研究顯示,螞蟻集團正在探索更具成本效益的 AI 訓練方式,試圖突破昂貴 GPU 的限制,推動 AI 技術的普及應用。
中國 AI 技術實力提升
MoE 模型已成為 AI 領域的一大趨勢,Google 和中國新創公司 DeepSeek 均採用該技術來提升運算效率。該模型透過將任務拆分為不同部分,類似專業團隊的協作,提高 AI 訓練的效能。
螞蟻集團已將「Ling」系列 AI 模型開源。其中,「Ling-Lite」擁有 168 億個參數,而「Ling-Plus」則達 2900 億個參數。相比之下,專家估計 ChatGPT 的 GPT-4.5 參數量達 1.8 兆,DeepSeek-R1 則約 6710 億。
螞蟻集團近期發表的研究論文聲稱,其 AI 模型在某些基準測試中表現優於 Meta(Facebook 母公司),並且在中文基準測試中,Ling-Lite 和 Ling-Plus 兩款模型皆超越 DeepSeek 模型。如果這些結果獲得驗證,將證明中國 AI 技術的實力正逐步提升。
輝達執行長黃仁勳此前曾表示,企業未來仍將仰賴更高效能的 GPU 來增加運算能力,而非尋求更便宜的解決方案。然而,螞蟻集團的研究卻顯示,在美國對華技術封鎖的背景下,中國 AI 企業正在尋找替代方案,以更低成本發展自身技術。
中國 AI 的自給自足之路
彭博行業研究分析師 Robert Lea 指出,螞蟻集團的研究顯示,中國 AI 技術的創新能力正在加速發展,並逐步減少對美國高端晶片的依賴。
然而,研究也指出,螞蟻集團在訓練 AI 模型時仍面臨穩定性挑戰,例如硬體或模型結構的微小變動可能導致錯誤率飆升,顯示中國製晶片在 AI 訓練方面仍需進一步優化。