據報道,在經歷了幾次與安全和微調相關的延遲後,備受期待的 ChatGPT「高級語音模式」(AVM)現已在 Alpha 版中向部分用戶開放。
什麼是進階語音模式(AVM)
進階語音模式(AVM)是 OpenAI 為 ChatGPT 開發的功能,最初於五月宣佈並展示,它允許使用者透過即時語音與ChatGPT人工智慧模型進行互動對話。這種模式利用文字轉語音的合成技術,使得ChatGPT能夠用人類般的聲音回應使用者的問題和指令,而且具有自然的語調。
這項技術的目的是模仿人與人之間的即時對話,提升使用者與AI互動的自然度和流暢性。使用者可以在對話中隨時打斷ChatGPT,而ChatGPT能夠根據對話內容適應性地回應,就像與真人交談一樣。
安全優先
然而,這項技術在五月發布時仍然存在一些缺陷,且該技術本身所帶來的潛在安全隱患(如偽造他人聲音)也是一大硬傷。根據 OpenAI 的說法,安全一直是該公司的首要關注點。在 X 平台上宣布這項功能推出的貼文中,該公司寫道:
「我們與 100 多個外部紅隊(Red Teaming) 成員在 45 種語言中測試了GPT-4的語音功能。為了保護人們的隱私,我們訓練模型只使用四種預設聲音進行說話,並建立了阻止與這些聲音不同的輸出的系統。」
根據 OpenAI 的說法,AVM 的限時發布已經開始,並將繼續增加更多用戶「滾動」加入。該公司預計這項功能將在秋季向所有 Plus 訂閱用戶開放。