Gate 广场|3/5 今日话题: #比特币创下近一月新高
🎁 解读行情走势,抽 5 位锦鲤送出 $2,500 仓位体验券!
随着白宫表示已向参议院提交凯文·沃什担任美联储主席的提名,美国参议院未通过叫停特朗普打击伊朗的投票,比特币于今日凌晨创下 2 月 5 日以来新高,最高触及 74,050 美元,加密货币总市值回升突破 2.538 万亿美元。
💬 本期热议:
1️⃣ 凯文·沃什的提名是否意味着降息预期升温?
2️⃣ 当前关口,你是持币待涨、顺势追多,还是反手布局回调?
分享观点,瓜分好礼 👉️ https://www.gate.com/post
📅 3/6 15:00 - 3/8 12:00 (UTC+8)
GPT-5.4 发布,未来 AI 的迭代方向明确了。当前 AI 领域已经从对话框走出往系统智能体演进,人类负责审美,AI 负责实施,走向人机协同的工作流。
➤ GPT-5.4核心升级要点
1、将 GPT-5.2 的通用推理与 GPT-5.3-Codex 的顶尖编程能力合二为一
2、支持 100 万 token 窗口(约 5000 页文档),并解决了长文本容易遗忘的痛点
3、原生电脑操作, 模型可以直接像人一样看屏幕、鼠标、敲键盘。在 OSWorld 测试中,75.0% 的成功率已超越人类平均水平
4、引入中途打断功能。对话不再是死板的回合制,用户可以在模型思考或回答时随时插入新要求
5、效率与成本优化, 引入 Tool Search 机制。模型不再需要预载所有工具定义,而是按需查找,大幅节省了 47% 的 token 消耗。
➤ 为什么会这样?
当前,全球顶尖AI实验室都面临着数据墙。最多到2026年,全人类产生的高质量文本、代码、书籍,可能被大模型大规模采集完毕,对于文本的训练已到了瓶颈期,像 Claude code、codex、openclaw 都是和当前的操作系统深度整合,代替人一部分操作调用系统工具,且具有自主意识,以完成任务为目标。
还有一件很多人不知道的事情是 codex 系列模型是和 Codex 框架一同训练出来的,也就是说,codex 系列模型和 Codex 框架互为 native,模型天然就能调用 codex 里的所有开发工具。
➤ 深度解读未来AI的发展方向
1. 从API 缝合转向操作系统级原生
GPT-5.4 展示的 Computer Use能力,从对话框走出到了整个操作系统。
以前模型只是在一个受限的 Sandbox(沙盒)里写代码,升级以后将拥有物理意义上的手。不仅懂代码逻辑,还能理解点击、拖拽、终端报错的视觉反馈。
新的框架层将不再是一堆预设的工具函数,而是对 OS(操作系统)的深度感知。模型在训练时就学习了如何观察屏幕并反馈,这使得它能像资深工程师一样,一边改代码,一边在浏览器调试窗口查看 UI 变化,实现自循环的端到端开发,这点已在 codex 上实现。
2. 百万上下文+长程任务架构设计+记忆系统=全能架构师
Codex 三层架构中,模型层提供了结构化推理。GPT-5.4 带来的 100 万 token 上下文,本质上是为这种推理提供了更广阔的画布。
OpenAI 的记忆系统一直遥遥领先,随着无损记忆,无限记忆的发布。尤其当模型和框架互为 Native 时,模型可以瞬间检索整个代码库(百万 token 级),框架可以精准地把修改应用到数十个关联文件中。
现在在 codex 里已经能实现全架构重写,精准理解代码含义。
3. 工具调用的搜索化与动态扩展
GPT-5.4 引入的 Tool Search(工具搜索) 机制,让框架理解模型的输出模式,模型拿到更多的上下文信息从而精准操作。
未来的发展方向是不会预载成千上万个工具库(避免 Token 浪费),而是当模型推理到我需要一个数据可视化组件时,实时通过 Tool Search 抓取定义并加载,意味着现在的 Skills 可能会是一个中间的过渡产物,更多的工具将会嵌入模型内容有大模型自行选择调用哪一个工具。
好处是让大模型能保持极高的 Token 效率。它解决了工具越多模型越笨的悖论,让 Agent 的技能树可以无限延伸,自动优化,找到最优路径再训练到下一代的模型中去。
4. 实时交互,从回合制到随时打断修改
GPT-5.4 引入的中途打断功能,打破了 AI 生成的黑盒状态,思路不对及时调整。
在协同层面更多的引入人类的决策,而不是完全让 AI 自主运行,实现白盒化协同,人类负责审美、需求定义、方案选型等重要决策,AI 负责实施。
也因为引入实时介入能力,让 AI 从一次性交付任务的盲盒状态,变成了可以随时修改需求的工程伙伴。
简单理解新的 AI Native 模式(Codex + GPT-5.4),从 0 开始直接造一辆 F1 赛车,并且赛车的引擎、底盘、轮胎是从设计的第一天起就是为了极限速度而协同的。
未来,我们可能不再需要寻找更强的模型,而是寻找与开发环境整合得更深的系统。