小模型也能发现 Claude Mythos 检测的网络安全漏洞?AISLE:护城河在系统,不在模型

動區BlockTempo

资安新创 AISLE 用每百万 token 仅 0.11 美元的 3.6B 参数小模型,复现了 Anthropic 旗舰资安系统 Mythos 的部分核心展示。AI 资安能力的边界比你想的更“参差不齐”。
(前情提要:Anthropic 发布 Mythos 之时,会是 DeFi 的核爆时刻吗?)
(背景补充:Anthropic Mythos 太强吓出紧急会议:贝森特、鲍尔召集花旗,高盛,美银,大小摩,五大银行聚焦金融风险)

本文目录

Toggle

  • Mythos 展示了什么,小模型又复现了什么?
  • 为什么更大的模型,不等于更安全的系统
  • 護城河在哪裡、不在哪裡

Anthropic 本周发布尚未公开的模型 Claude Mythos Preview,并同步启动 Project Glasswing 玻璃翼计划,由亚马逊、苹果、微软、CrowdStrike、思科等 12 家科技公司组成,使用该模型进行防御性资安研究。

因为 Mythos 据称自主找出每个主要操作系统与浏览器中的数千个零日漏洞(zero-day vulnerability,指尚未公开修补、连厂商都可能不知道的安全缺陷),暗示一个由 AI 主导资安防御的新纪元即将开启。

然而不到一周,由前 DeepMind 与 Anthropic 研究员 Stanislav Fort 共同创办的资安新创 AISLE,在公司技术博客发表了一份系统性报告。

核心结论直接:在 Mythos 的旗舰展示任务中,一个 active 参数仅 3.6B、每百万 token 花费 0.11 美元的开源小模型,达成了相同的漏洞侦测结果。

Mythos 展示了什么,小模型又复现了什么?

AISLE 设计了三组测试,分别对应不同难度与性质的资安任务。

第一组 是 OWASP(开放 Web 应用安全项目)误报性测试。

翻译过来就是,一段 Java SQL 查询程序代码看起来像 SQL Injection(数据库注入攻击),但实际上逻辑安全。正确答案是非漏洞。

测试结果呈现近乎逆向的 scaling(规模缩放)效应:小型开源模型 GPT-OSS-20b(3.6B active 参数,$0.11/M tokens)正确追踪了程序逻辑,判定无害。

相反地,Claude Sonnet 4.5、所有 GPT-4.1/5.4 系列(o3 与 pro 除外)、Anthropic 全系列至 Opus 4.5,均自信地误判为高危漏洞。只有极少数顶端模型 — o3、OpenAI-pro、Sonnet 4.6、Opus 4.6 答对。

第二组 是 FreeBSD NFS 漏洞,即 Mythos 旗舰发布中特别展示的 CVE-2026-4747,一个 17 年历史、未授权远端程序执行漏洞。

结果:8/8 个受测模型全部成功侦测,包括那个 3.6B active 参数的小模型。所有模型均正确识别出 stack buffer overflow(堆栈缓冲区溢出)、计算剩余空间,并将其评为 Critical RCE。

AISLE 的结论是:此类侦测能力已“商品化”。

第三组 是 OpenBSD SACK 漏洞(27 年历史),需要真正的数学推理:追踪有符号整数溢位(signed integer overflow)的多步骤逻辑链。

难度显著提升,模型表现分化。GPT-OSS-120b(5.1B active 参数)完整复现了漏洞利用链,AISLE 评为 A+;Kimi K2 开源版本得 A-;而 Qwen3 32B 则给出“代码很健壮”的错误结论,评 F。

即便在这个更困难的任务上,一个成本极低的开源模型仍然达成了旗舰系统的同等展示。

为什么更大的模型,不等于更安全的系统

这份报告的真正论点不是“小模型够用”,而是 AI 资安能力的结构远比外界想象复杂。

AISLE 将资安 AI 管线拆解为五个独立子任务:

  • 广谱扫描(broad scanning)
  • 漏洞侦测(vulnerability detection)
  • 分流验证(triage and validation)
  • 修补生成(patch generation)
  • 漏洞利用构建(exploit construction)

每个子任务的 scaling 性质不同,所需的模型能力也不同。Mythos 的公告将这五个层次整合呈现为一个完整系统,但实际上它们的模型需求差异极大,某些子任务在 3.6B 参数下已完全饱和,某些则需要复杂推理能力。

这呼应了 2023 年哈佛商学院研究者 Dell’Acqua 与 Mollick 等人提出的“Jagged Frontier”(参差不齐边界)概念:AI 能力的边界不是一条平滑曲线,而是凹凸不平的锯齿状,在某些任务上远超人类,在相邻任务上却意外脆弱。

该研究显示,若使用者在能力边界内部署 AI,生产力提升约 40%;若贸然延伸至边界外,表现反而下降 19%。

AISLE 在这个框架下提出了更具操作性的推论:“一千个够用的侦探无处不搜,比一个天才侦探猜测在哪裡找,能发现更多漏洞。”

大量部署低成本模型进行广谱扫描,在总体效益上可能优于谨慎排程单一高成本模型。AISLE 表示自 2025 年中旬起已在真实目标上执行漏洞发现系统:在 OpenSSL 中找到 15 个 CVE(其中单次安全版本包含 12 个,CVSS 9.8 Critical),curl 中 5 个,跨超过 30 个项目共计逾 180 个外部验证 CVE。

護城河在哪裡、不在哪裡

这份分析对 Anthropic 而言既非全面批评,也非单纯背书。

AISLE 明确表示,Mythos 的意义在于证明“AI 资安”这个类别是真实的,它不只是演示实验室里的概念,而是可以在真实目标上运作的系统。Anthropic 正在做的,是最大化“每 token 的智慧密度”,这在需要深度推理的任务上仍有难以替代的价值。

但 AISLE 同时指出了一个对整个产业而言更根本的问题:護城河在系统,不在模型本身。

在资安领域,AISLE 认为嵌入深度专业知识的架构设计,例如:如何分解任务、如何在子任务间排程不同成本的模型、如何在生产环境中维持维护者信任,才是真正的差异化来源。

一个能在 OpenSSL 里找出 CVSS 9.8 漏洞的系统,与一个在受控展示中侦测到已知模式漏洞的系统,需要的不只是更强的模型,而是完全不同的工程逻辑。

总的来说,AISLE 的报告发现:更廉价、更开放的模型已能复现其部分核心展示。真正的问题或许不是谁的模型最强,而是由谁先把这五个子任务的架构在生产环境中跑通。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

现代汽车集团围绕人工智能与机器人进行重组,目标到2030年部署30,000台Atlas机器人

现代汽车集团正在重组,重点转向人工智能和机器人,并削减传统业务。该集团计划到2030年在机器人领域投入343亿美元,并旨在推出机器人即服务模式,与Google DeepMind和NVIDIA合作。

GateNews1小时前

NEA 探索在核监管中使用人工智能

NEA关于新技术的工作组于3月25日至26日召开了研讨会,重点探讨如何在核主管机构内部运营以及监管监督中应用人工智能。 摘要 NEA研讨会探讨了人工智能在核监管中的真实世界应用,其中包括

Cryptonews 4小时前

中国将于4月19日在北京半程马拉松测试300+台类人机器人

北京第二届机器人半程马拉松将有来自70支队伍的300多台类人机器人参赛,赛道全长21公里。重点展示自主移动方面的进展,其中40%的机器人无需控制即可运行。尽管生产面临挑战,中国仍在类人机器人市场占据主导地位。

GateNews6小时前

美国寻求增加从纳米比亚进口铀以驱动AI驱动的核电厂

美国正在考虑从纳米比亚增加铀进口,以支持为AI数据中心供能的核能,因为中国主导了纳米比亚的铀行业。不断上涨的铀价格正在重新点燃采矿兴趣,尽管该干旱地区存在供水挑战。

GateNews6小时前

OpenAI 高管比尔·皮布尔斯和凯文·韦尔在领导层重组中离任

OpenAI 高管比尔·皮布尔斯(Bill Peebles)和凯文·韦尔(Kevin Weil)宣布离职,这是公司在将业务去中心化过程中一系列领导层变动的一部分。两人的离开紧随数位其他备受关注的高管离职,以及公司架构的调整。

GateNews8小时前

Zoom 与 World 合作:借助面部识别增加深度伪造检测

Zoom 已与 Sam Altman 的 World 合作,在视频通话期间推出一项用于检测真实参与者与 AI 深度伪造的功能。该功能旨在打击日益猖獗的深度伪造诈骗,并为主持人和参与者提供验证选项。

GateNews8小时前
评论
0/400
暂无评论