zombie
> > > >
> > > >

便宜 20 倍、性能只低 8%!傳言谷歌下週發表 Gemini 3.2 Flash,直擊 GPT-5.5 腹地

2026/05/14 17:30
便宜 20 倍、性能只低 8%!傳言谷歌下週發表 Gemini 3.2 Flash,直擊 GPT-5.5 腹地

據資深科技記者 Alex Heath 爆料,Google 計劃在Google I/O 年度開發者大會(5 月 20 日)推出新一代輕量化模型 Gemini 3.2 Flash。這款模型被視為 Google 的「刺客產品」,傳出其推理成本僅為 OpenAI GPT-5.5 的二十分之一,但核心性能卻能達到對方的九成以上。

Flash 級別、旗艦戰鬥力

根據 Abacus.AI 執行長 Bindu Reddy 透露的技術細節,Gemini 3.2 Flash 在編碼(Coding)與推理(Reasoning)任務上的表現極其驚人,已達到 GPT-5.5 水準的 92%。最令業界關注的是其極致的成本優化與低延遲表現。

據稱,新模型的推理成本僅為 GPT-5.5 的 1/15 至 1/20,且大多數查詢的延遲被壓低在 200 毫秒以內。透過「模型蒸餾(Distillation)」與「稀疏化(Sparsification)」技術,Google 成功將前沿旗艦模型的能力壓縮進 Flash 等級,且未出現輕量模型常見的性能崩潰。

五月初早有徵兆

事實上,Gemini 3.2 Flash 的出現並非無跡可尋。今年 5 月初,開發者便在 iOS 應用構建包與 AI Studio 的元數據中發現了該模型的痕跡。

隨後,該模型疑似以匿名身份出現在 LM Arena 評測中,引發測試者熱議。早期反饋指出,該模型在「創意編碼」任務中表現尤為突出,甚至在部分基準測試中超越了現有的旗艦級模型 Gemini 3.1 Pro。

對標 GPT-5.5,僅次於 Anthropic Mythos

報導指出,Google 此次的策略非常明確:Gemini 3.2 Flash 的整體性能將與 GPT-5.5 處於同等級別,雖然在絕對實力上仍略遜於 Anthropic 目前的巔峰之作 Mythos,但在「性價比」與「響應速度」上,Gemini 3.2 Flash 幾乎沒有對手。

這意味著對於需要處理海量數據、即時客服或複雜 Agent 自動化工作流的企業用戶來說,這款新模型將極具吸引力。

join Zombit

加入桑幣的社群平台,跟我們一起討論加密貨幣新資訊!

桑幣熱門榜

zombie

桑幣正在徵文中,我們想要讓好的東西讓更多人看見!
只要是跟金融科技、區塊鏈及加密貨幣相關的文章,都非常歡迎向我們投稿
投稿信箱:[email protected]

為提供您更多優質的服務與內容,本網站使用 cookies 分析技術。若您繼續閱覽本網站內容,即表示您同意我們使用 cookies,關於更多相關隱私權政策資訊,請閱讀我們的隱私權及安全政策宣示