社群平台 X 已於今日下午正式開源其「For You」推薦動態的核心演算法,首度完整揭露平台如何在龐大的內容洪流中,決定使用者每天看到哪些貼文。
與過去依賴大量人工規則與特徵工程的推薦系統不同,這套新架構幾乎完全交由 Grok 為基礎的 Transformer 模型負責判斷內容相關性,是目前市場上最「AI 原生」的社群平台演算法,也象徵 X 在內容推薦策略上的重大轉向。
兩條內容來源,一套模型排序
根據官方說明,X 的 For You 動態同時整合兩大內容來源:一是來自使用者已追蹤帳號的「網內內容(in-network)」,二是透過機器學習模型,從全站發掘的「網外內容(out-of-network)」。兩者會被放在同一個池子中競爭排序,而非分開顯示。
在系統架構上,X 將內容取得與排序清楚拆分。
首先,來自追蹤帳號的貼文由名為 Thunder 的即時系統提供。Thunder 是一套記憶體內運作的貼文儲存與分發管線,會即時追蹤所有帳號的最新發文,並為每位使用者保留其追蹤名單內的近期內容,使系統能在毫秒等級內取得相關貼文,而不需查詢外部資料庫。
至於網外內容(也就是為訂閱帳戶所發布的內容),則交由 Phoenix Retrieval 模組負責。這是一套基於機器學習的相似度搜尋系統,會將使用者的互動歷史(按讚、回覆、轉貼等)轉換為向量,再與全站貼文進行比對,挑選出「可能感興趣」的內容。
這兩類候選貼文在被收集後,會進入同一條排序流程,由 Phoenix 的 Grok-based Transformer 模型進行評分。
Grok 模型接管一切「相關性判斷」
X 指出,新版 For You 演算法的核心變化,在於全面移除人工設計的特徵與啟發式規則,不再由工程師手動定義「什麼內容重要」,而是交由 Grok 為基礎的模型,直接從使用者的互動行為中學習偏好。
Phoenix 排序模型會同時預測多種互動行為的機率,包括按讚、回覆、轉貼、點擊,以及封鎖或檢舉等負向反應,並依權重加總成最終分數,決定貼文在動態中的排序位置。
為確保排序穩定性,模型採用「候選隔離」設計,每則貼文只依據使用者背景評分,不受同批次其他內容影響。同時,系統仍保留基本過濾與多樣性機制,移除重複、過舊或不適當內容,並避免單一帳號過度佔據版面。
新演算法運作流程
具體來說,X(前 Twitter)最新開源的演算法將按照以下流程運作:
- 當你打開 X 的「為你推薦(For You)」頁面時,系統會先蒐集你的個人使用資訊,例如你追蹤了誰、過去按讚、回覆或分享過哪些貼文,作為個人化推薦的基礎。
- 接著,系統會從兩個主要來源蒐集潛在貼文:
• 來自你已追蹤帳號的內容(in-network)
• 來自整個 X 平台、你尚未追蹤但可能感興趣的新內容(out-of-network) - in-network 貼文來自一套高速系統 Thunder,會將你追蹤帳號的最新動態暫存在記憶體中,讓系統能快速抓取內容、減少延遲。
- 至於 out-of-network 貼文,系統會透過 AI 分析你的興趣輪廓(依據過往行為),並與全站貼文進行比對,挑選出看起來最相關或最相似的內容。
- 在取得這些候選貼文後,系統會替每一則貼文補上完整資訊,例如貼文文字、圖片、影片、作者名稱、是否為驗證帳號,以及是否有付費牆等標記。
- 接下來,系統會進行「清洗」流程,移除重複內容、過舊貼文、你自己的貼文、來自你封鎖或靜音的帳號、你不喜歡的關鍵字,以及你已經看過的內容。
- 然後,一個基於 Grok 的強大 AI 模型,會根據你過去的互動紀錄,預測你對每則貼文按讚、回覆、轉貼、點擊,甚至按不喜歡的機率,並為每則貼文打分。
- 系統會將這些互動預測整合成一個最終分數,對正向行為(如按讚)加權,對負向行為(如封鎖)扣分,同時調整內容多樣性,避免單一帳號過度佔據版面。
- 依照最終分數排序後,系統會挑選分數最高的貼文,組成你的動態頁面,確保內容在熟悉與新鮮之間取得平衡。
- 最後,系統會再進行一次檢查,移除已刪除、垃圾、暴力或不當內容,然後將排序完成的貼文呈現在你的畫面上,供你瀏覽。
從「規則導向」走向「模型導向」
整體而言,X 的新 For You 演算法代表推薦系統從「工程師主導規則」正式轉向「模型主導理解」。透過 Grok 模型統一處理內容理解、偏好判斷與排序決策,X 試圖降低系統複雜度,同時讓推薦結果更貼近使用者真實行為。
在社群平台愈來愈仰賴演算法決定公共討論版面的情況下,X 此次全面開源,不僅揭露其技術路線,也讓外界得以一窺未來社群平台如何以大型語言模型,重新定義「你為什麼會看到這些內容」。