OpenAI Codex 團隊修復 OpenClaw 驗證錯誤,顯著改善代理行為

門戶新聞訊息,4 月 23 日——OpenAI Codex 團隊正著力於在 OpenClaw 中最佳化 OpenAI 模型體驗;Codex 工程負責人 Tibo Sottiaux 與 OpenClaw 創作者 Peter Steinberger 共同合作。Codex 產品負責人 Nik Pash 發現了一個關鍵的驗證漏洞:當 OpenClaw 被設定為使用 Codex harness 搭配 OpenAI 模型時,驗證流程會失敗,系統會靜默回退到 Pi harness,導致使用者誤以為 Codex harness 正常運作,而實際上並非如此。

Pash 提交了兩個拉取請求來解決該問題:一個用於修復驗證橋接,另一個用於防止靜默回退。這些改進完全來自切換底層執行階段介面適配器 (harness),該適配器決定 OpenClaw 如何與模型 API 溝通,而代理程式的提示與更高層級的工作流程邏輯則保持不變。

修復前後,代理程式的行為出現了明顯差異。使用 Pi harness 時,代理程式會在每次心跳中進行淺層輪詢:讀取心跳檔案、檢查 Discord、回傳 HEARTBEAT_OK,並忽略其他指令。它有時會推斷需要執行的操作,但卻未能發出工具呼叫。切換到 Codex harness 之後,代理程式進入完整的工作迴圈:讀取工作區上下文、解析任務清單、檢查程式庫、執行編輯並嘗試驗證。後續的心跳即可接續進度,而不是重複先前的工作。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Perplexity 揭露 Web 搜尋代理後訓練方法;基於 Qwen3.5 的模型在準確率與成本上超越 GPT-5.4

Perplexity 使用搭配 Qwen3.5 模型的 SFT,並在其後使用帶有 RL 的強化學習;透過多跳 QA 資料集與規則量表檢查來提升搜尋的準確性與效率,實現業界一流的 FRAMES 表現。 摘要:Perplexity 的線上搜尋代理後訓練流程,結合監督式微調 (SFT),以透過線上強化學習 (RL)(使用 GRPO 演算法)來強制遵循指令與語言一致性。RL 階段使用專有的多跳可驗證問答資料集,以及基於規則量表的對話資料,以防止 SFT 漂移,並採用獎勵閘控與同組內效率懲罰。評估顯示 Qwen3.5-397B-SFT-RL 在 FRAMES 上取得頂尖表現:單次工具呼叫準確率為 57.3%,四次呼叫為 73.9%,每次查詢成本為 $0.02;在這些指標上超越 GPT-5.4 與 Claude Sonnet 4.6。定價採用 API 計費,且不包含快取。

GateNews15分鐘前

OpenAI 推 ChatGPT Workspace Agents:Codex 驅動、團隊共享、Slack 整合

OpenAI於4月22日在ChatGPT Business/Enterprise/Edu/Teachers推出WorkspaceAgents,由Codex驅動、雲端長時、團隊共用且可離線執行,能在Slack主動回應與開票、執行多步工作流,並支援排程。研究預覽免費到5月6日,之後採credit-based收費,價格待公布。與GoogleGeminiEnterpriseAgentPlatform、AnthropicClaudeCowork同場競爭,三家聚焦企業級代理但定位各有不同。

鏈新聞abmedia2小時前

Google Cloud Next 2026:推出 Gemini 企業代理平台,7.5 億美元助顧問落地

Google Cloud 在 Cloud Next 2026 公布 Gemini Enterprise Agent Platform,整合模型選擇、代理建構、DevOps、編排與企業安全控管,並推出 7.5 億美元基金協助 McKinsey、Accenture、Deloitte 部署企業代理。平台搭配 Ironwood TPU、A2A 與 MCP,打造自家全棧與顧問通路,對抗 OpenAI Operator 與 Anthropic Claude 企業版。

鏈新聞abmedia2小時前

Google 擴展 Wiz 雲端安全性至 AWS、Azure 和 Google Cloud

Google 宣布新的安全功能,以及它在 Cloud Next '26 活動中,所收購的以色列雲端安全公司 Wiz,於其 Google Cloud 與競爭對手平台之間更深度的整合;這筆交易據稱為 US$32 billion。該公司在預覽模式下推出三個用於安全營運的 AI 代理,旨在為

Crypto Frontier2小時前

360 AI 漏洞發現代理發現近 1,000 個零日漏洞,與 Mythos 展開競爭

360 Digital Security 以 AI 驅動的代理聲稱已發現約 1,000 個新的漏洞,其中包括 Office 與 OpenClaw;AI 如今已成為發現與利用鏈準備的核心,與 Mythos 不相上下。 摘要:一份被《彭博社》引述的報告指出,360 Digital Security Group 的 AI 驅動漏洞發現代理在近幾個月內已辨識出近 1,000 個先前未知的漏洞,其中包括在 Microsoft Office 與 OpenClaw 框架中。該公司表示,AI 已成為漏洞發現的核心引擎,並宣布了一款 AI 工具以加速利用鏈的構建。Benincasa 依據 Natto Thoughts 對該公司中文公告的審閱,將 360 描述為 Anthropic 的 Mythos 競爭者。

GateNews13小時前

Aethir Claw V1 推出:五分鐘內不寫程式部署 AI 代理

Gate 新聞訊息,4 月 22 日— Aethir,一家去中心化 GPU 雲端基礎設施提供商,今天推出其 AI 代理託管平台 Aethir Claw 的 1.0 版本。該平台讓沒有技術背景的用戶能夠在瀏覽器內於五分鐘內部署並配置 AI 代理

GateNews15小時前
留言
0/400
暫無留言