AISI 評估:GPT-5.5 網路攻擊能力與 Anthropic Mythos 持平

鏈新聞abmedia

英國 AI 安全研究所(AI Security Institute, AISI)5 月 1 日發布針對 OpenAI GPT-5.5 的網路攻擊能力評估報告,指 GPT-5.5 在 Expert 難度測試的成功率為 71.4%、Anthropic Claude Mythos Preview 為 68.6%,差距落在統計誤差範圍內。GPT-5.5 也是繼 Mythos 之後第二個能自主完成 AISI 32 步驟「The Last Ones」企業網路全程模擬入侵的 AI 系統。AISI 警告,這顯示 AI 攻擊能力的快速進步可能屬於一個「整體趨勢」,而非單一突破事件。

Expert 難度測試:71.4% vs 68.6%、差距落於誤差內

AISI 是英國科學、創新與技術部下的 AI 安全研究機構。本次測試是 AISI 針對 frontier AI 模型攻擊性網路能力的最新一輪評估。在最高 Expert 難度題目,GPT-5.5 平均成功率 71.4%、Mythos Preview 68.6%,兩者差距落在統計誤差範圍內,意味目前 OpenAI 與 Anthropic 旗艦模型的攻擊能力已實質持平。

32 步驟模擬企業網路入侵測試「The Last Ones」是 AISI 最具挑戰性的評估項目:GPT-5.5 在 10 次嘗試中自主完成 2 次(無人工介入),Mythos Preview 在 10 次中完成 3 次。這個項目過去只有 Mythos 完成過,GPT-5.5 是第二個達標的模型。另一項測試中,GPT-5.5 用約 10 分鐘破解一道反向工程題,而人類安全專家平均需要 12 小時。

Universal jailbreak:6 小時紅隊開發即可繞過所有惡意查詢過濾

AISI 研究員在測試中也發現一個「universal jailbreak」(通用越獄)攻擊向量:在所有測試的惡意網路查詢類別中,這個攻擊都能誘使 GPT-5.5 輸出有害內容、包含多輪 agentic 對話情境。AISI 表示,紅隊專家花約 6 小時就開發出這個 jailbreak。

對 OpenAI 而言,這個 universal jailbreak 的存在意味即使 GPT-5.5-Cyber 部署在 trusted access 計畫等限縮存取的場景,仍可能被技術熟練的對手繞過。OpenAI 在 GPT-5.5 system card 中已揭露網路安全相關評估,但 AISI 的獨立第三方評估提供更具公信力的同儕基準。

後續觀察:AISI 下一輪評估時程、OpenAI 對 jailbreak 的應對

下一個觀察點是 AISI 在 Mythos 與 GPT-5.5 之後的下一輪 frontier 模型評估時程,以及 OpenAI 對本次揭露的 universal jailbreak 是否在 5 月發布針對性更新。AISI 在報告結語明確表示,「如果攻擊性網路能力是更廣泛推理、編碼、自主任務改善的副產品,後續進步可能會以更快節奏到來」—這個觀察意味未來幾個月可能再有 frontier 模型進入「Mythos 級」門檻。

這篇文章 AISI 評估:GPT-5.5 網路攻擊能力與 Anthropic Mythos 持平 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

霍斯金森在 The Breakdown 談論 Midnight 在 Cardano 生態系中的角色

Cardano 創辦人暨以太坊聯合創辦人查爾斯·霍斯金森(Charles Hoskinson)出現在由大衛·戈克什泰因(David Gokhshtein)主持的播客《The Breakdown》第 701 集,與他討論 Midnight 專案、加密貨幣的使用者體驗挑戰,以及他對區塊鏈未來的願景。在訪談期間,霍斯金森

Crypto Frontier3小時前

波克夏能源商業看見來自由 AI 驅動的電力需求之成長機會

根據 Beating,在 Berkshire 的股東大會上,CEO Abel 強調,AI 驅動的用電需求正在為公司能源業務創造新的成長機會,而其一半能源公用事業已在處理與 AI 相關的用電需求。 在愛荷華州,資料中心目前占據

GateNews5小時前

Musk Vs Altman 訴訟首週證詞:自承 XAI 蒸餾 OpenAI、警告 AI 像終結者

馬斯克在奧克蘭聯邦法院首週訴訟證詞指控阿特曼與 Brockman 騙取早期非營利資金、警告 AI 末日風險,並自承 xAI 部分蒸餾自 OpenAI 模型;他自述投入 3,800 萬美元,見證 OpenAI 從非營利轉為估值 8 千億美元。 Microsoft 2022 投資被視為信任崩壞的轉折點。 OpenAI 辯稱馬斯克企圖挖角、以競爭對手動機抗辯。 後續於第二週證人包括 Russell 與 Brockman。

鏈新聞abmedia7小時前

與川普相關的 AI 金融收購 Block Street,金額 4300 萬美元

根據《財富》雜誌,AI Financial(與川普家族有關的加密貨幣公司,先前名為 Alt5 Sigma)上週以 4300 萬美元收購 Block Street(一家加密基礎設施公司)。AI Financial 的顧問、Block Street 執行長 Matthew Morgan 表示,此次收購並非一

GateNews8小時前

Riot 的股價在擴大 AMD 資料中心交易後上漲 8%

比特幣礦工 Riot 的股價在其與 AMD 的資料中心合約擴大後上漲 8%。擴大的合作包含改善的融資條款,凸顯 Riot 正在策略上從比特幣挖礦轉向人工智慧資料中心營運。此舉顯示信心正在增強

GateNews10小時前

明尼蘇達州禁止 AI 非經同意的露骨影像工具,並處以最高 $500K 罰金

根據 Decrypt,明尼蘇達州的立法機關在 5 月 2 日通過一項法案,禁止網站和應用程式提供會生成人可辨識個人、且未經同意的親密影像的 AI 工具。該法律禁止平台允許用戶存取或使用這類「深偽」工具,並禁止

GateNews12小時前
留言
0/400
暫無留言