zombie
> > > >
> > > >

馬斯克所言不虛!Grok 3 測試結果出爐,各方面皆吊打其他 AI 模型

2025/02/18 14:26
馬斯克所言不虛!Grok 3 測試結果出爐,各方面皆吊打其他 AI 模型

Grok 3 完勝對手

根據知名 AI 模型排名開源平台 lmarena.ai 的最新測試數據顯示,xAI 早期版本的 Grok 3(代號「chocolate」) 在 Arena 排行榜上排名第一。

在這次測試結果中,Grok-3 創下多項紀錄,其中包括成為史上首個突破 1400 分的語言模型,並在數學、創意寫作、多輪對話、編程等測試類別中全數拿下第一名。

Gkcwqiawsaagvhw

使用者可以在此網站參與模型的測試,並投票選擇哪一個模型更為優秀。

馬斯克所言不虛?

根據 Zombit 此前報導,馬斯克在《世界政府高峰會》的活動上發表演說時透露,Grok 3 將在幾週內問世,並自信的表示 Grok 3 將超越迄今為止所有其他人工智慧模型。其在演講中說道:

「有時我覺得Grok 3 聰明得可怕…我們正處於打磨 Grok 3 的最後階段,可能會在一兩週內發布,所以很快就來了。」

如今從測試結果來看,馬斯克似乎並不是「老馬賣『Grok』,自賣自誇」。

實際產品恐令人失望

然而,儘管 Grok 3 在測試結果表現突出,但實際相用戶推出的似乎不會是完整版本,而是被削弱的閹割版。知名開發者 banteg 指出,Grok 3 已經向部分用戶推出,但似乎與他們展示的版本有所不同,其在推文中表示:

「DeepSearch 只執行一次搜尋 + 推理,並且削弱後甚至無法搜尋 X 上的貼文。」

join Zombit

加入桑幣的社群平台,跟我們一起討論加密貨幣新資訊!

桑幣熱門榜

zombie

桑幣正在徵文中,我們想要讓好的東西讓更多人看見!
只要是跟金融科技、區塊鏈及加密貨幣相關的文章,都非常歡迎向我們投稿
投稿信箱:[email protected]

為提供您更多優質的服務與內容,本網站使用 cookies 分析技術。若您繼續閱覽本網站內容,即表示您同意我們使用 cookies,關於更多相關隱私權政策資訊,請閱讀我們的隱私權及安全政策宣示