资安新创 AISLE 用每百万 token 仅 0.11 美元的 3.6B 参数小模型，复现了 Anthropic 旗舰资安系统 Mythos 的部分核心展示。AI 资安能力的边界比你想的更“参差不齐”。
（前情提要：Anthropic 发布 Mythos 之时，会是 DeFi 的核爆时刻吗？）
（背景补充：Anthropic Mythos 太强吓出紧急会议：贝森特、鲍尔召集花旗,高盛,美银,大小摩，五大银行聚焦金融风险）

本文目录

Toggle

Mythos 展示了什么，小模型又复现了什么？
为什么更大的模型，不等于更安全的系统
護城河在哪裡、不在哪裡

Anthropic 本周发布尚未公开的模型 Claude Mythos Preview，并同步启动 Project Glasswing 玻璃翼计划，由亚马逊、苹果、微软、CrowdStrike、思科等 12 家科技公司组成，使用该模型进行防御性资安研究。

因为 Mythos 据称自主找出每个主要操作系统与浏览器中的数千个零日漏洞（zero-day vulnerability，指尚未公开修补、连厂商都可能不知道的安全缺陷），暗示一个由 AI 主导资安防御的新纪元即将开启。

然而不到一周，由前 DeepMind 与 Anthropic 研究员 Stanislav Fort 共同创办的资安新创 AISLE，在公司技术博客发表了一份系统性报告。

核心结论直接：在 Mythos 的旗舰展示任务中，一个 active 参数仅 3.6B、每百万 token 花费 0.11 美元的开源小模型，达成了相同的漏洞侦测结果。

Mythos 展示了什么，小模型又复现了什么？

AISLE 设计了三组测试，分别对应不同难度与性质的资安任务。

第一组 是 OWASP（开放 Web 应用安全项目）误报性测试。

翻译过来就是，一段 Java SQL 查询程序代码看起来像 SQL Injection（数据库注入攻击），但实际上逻辑安全。正确答案是非漏洞。

测试结果呈现近乎逆向的 scaling（规模缩放）效应：小型开源模型 GPT-OSS-20b（3.6B active 参数，$0.11/M tokens）正确追踪了程序逻辑，判定无害。

相反地，Claude Sonnet 4.5、所有 GPT-4.1/5.4 系列（o3 与 pro 除外）、Anthropic 全系列至 Opus 4.5，均自信地误判为高危漏洞。只有极少数顶端模型 — o3、OpenAI-pro、Sonnet 4.6、Opus 4.6 答对。

第二组 是 FreeBSD NFS 漏洞，即 Mythos 旗舰发布中特别展示的 CVE-2026-4747，一个 17 年历史、未授权远端程序执行漏洞。

结果：8/8 个受测模型全部成功侦测，包括那个 3.6B active 参数的小模型。所有模型均正确识别出 stack buffer overflow（堆栈缓冲区溢出）、计算剩余空间，并将其评为 Critical RCE。

AISLE 的结论是：此类侦测能力已“商品化”。

第三组 是 OpenBSD SACK 漏洞（27 年历史），需要真正的数学推理：追踪有符号整数溢位（signed integer overflow）的多步骤逻辑链。

难度显著提升，模型表现分化。GPT-OSS-120b（5.1B active 参数）完整复现了漏洞利用链，AISLE 评为 A+；Kimi K2 开源版本得 A-；而 Qwen3 32B 则给出“代码很健壮”的错误结论，评 F。

即便在这个更困难的任务上，一个成本极低的开源模型仍然达成了旗舰系统的同等展示。

为什么更大的模型，不等于更安全的系统

这份报告的真正论点不是“小模型够用”，而是 AI 资安能力的结构远比外界想象复杂。

AISLE 将资安 AI 管线拆解为五个独立子任务：

广谱扫描（broad scanning）
漏洞侦测（vulnerability detection）
分流验证（triage and validation）
修补生成（patch generation）
漏洞利用构建（exploit construction）

每个子任务的 scaling 性质不同，所需的模型能力也不同。Mythos 的公告将这五个层次整合呈现为一个完整系统，但实际上它们的模型需求差异极大，某些子任务在 3.6B 参数下已完全饱和，某些则需要复杂推理能力。

这呼应了 2023 年哈佛商学院研究者 Dell’Acqua 与 Mollick 等人提出的“Jagged Frontier”（参差不齐边界）概念：AI 能力的边界不是一条平滑曲线，而是凹凸不平的锯齿状，在某些任务上远超人类，在相邻任务上却意外脆弱。

该研究显示，若使用者在能力边界内部署 AI，生产力提升约 40%；若贸然延伸至边界外，表现反而下降 19%。

AISLE 在这个框架下提出了更具操作性的推论：“一千个够用的侦探无处不搜，比一个天才侦探猜测在哪裡找，能发现更多漏洞。”

大量部署低成本模型进行广谱扫描，在总体效益上可能优于谨慎排程单一高成本模型。AISLE 表示自 2025 年中旬起已在真实目标上执行漏洞发现系统：在 OpenSSL 中找到 15 个 CVE（其中单次安全版本包含 12 个，CVSS 9.8 Critical），curl 中 5 个，跨超过 30 个项目共计逾 180 个外部验证 CVE。

護城河在哪裡、不在哪裡

这份分析对 Anthropic 而言既非全面批评，也非单纯背书。

AISLE 明确表示，Mythos 的意义在于证明“AI 资安”这个类别是真实的，它不只是演示实验室里的概念，而是可以在真实目标上运作的系统。Anthropic 正在做的，是最大化“每 token 的智慧密度”，这在需要深度推理的任务上仍有难以替代的价值。

但 AISLE 同时指出了一个对整个产业而言更根本的问题：護城河在系统，不在模型本身。

在资安领域，AISLE 认为嵌入深度专业知识的架构设计，例如：如何分解任务、如何在子任务间排程不同成本的模型、如何在生产环境中维持维护者信任，才是真正的差异化来源。

一个能在 OpenSSL 里找出 CVSS 9.8 漏洞的系统，与一个在受控展示中侦测到已知模式漏洞的系统，需要的不只是更强的模型，而是完全不同的工程逻辑。

总的来说，AISLE 的报告发现：更廉价、更开放的模型已能复现其部分核心展示。真正的问题或许不是谁的模型最强，而是由谁先把这五个子任务的架构在生产环境中跑通。

View Source

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

现代汽车集团围绕人工智能与机器人进行重组，目标到2030年部署30,000台Atlas机器人

AI 行业动态

现代汽车集团正在重组，重点转向人工智能和机器人，并削减传统业务。该集团计划到2030年在机器人领域投入343亿美元，并旨在推出机器人即服务模式，与Google DeepMind和NVIDIA合作。

GateNews1小时前

NEA 探索在核监管中使用人工智能

AI 行业动态

NEA关于新技术的工作组于3月25日至26日召开了研讨会，重点探讨如何在核主管机构内部运营以及监管监督中应用人工智能。摘要 NEA研讨会探讨了人工智能在核监管中的真实世界应用，其中包括

Cryptonews 4小时前

中国将于4月19日在北京半程马拉松测试300+台类人机器人

AI 行业动态

北京第二届机器人半程马拉松将有来自70支队伍的300多台类人机器人参赛，赛道全长21公里。重点展示自主移动方面的进展，其中40%的机器人无需控制即可运行。尽管生产面临挑战，中国仍在类人机器人市场占据主导地位。

GateNews6小时前

美国寻求增加从纳米比亚进口铀以驱动AI驱动的核电厂

大宗商品 AI 行业动态

美国正在考虑从纳米比亚增加铀进口，以支持为AI数据中心供能的核能，因为中国主导了纳米比亚的铀行业。不断上涨的铀价格正在重新点燃采矿兴趣，尽管该干旱地区存在供水挑战。

GateNews6小时前

OpenAI 高管比尔·皮布尔斯和凯文·韦尔在领导层重组中离任

AI 行业动态

OpenAI 高管比尔·皮布尔斯（Bill Peebles）和凯文·韦尔（Kevin Weil）宣布离职，这是公司在将业务去中心化过程中一系列领导层变动的一部分。两人的离开紧随数位其他备受关注的高管离职，以及公司架构的调整。

GateNews8小时前

Zoom 与 World 合作：借助面部识别增加深度伪造检测

AI 行业动态

Zoom 已与 Sam Altman 的 World 合作，在视频通话期间推出一项用于检测真实参与者与 AI 深度伪造的功能。该功能旨在打击日益猖獗的深度伪造诈骗，并为主持人和参与者提供验证选项。

GateNews8小时前

0/400

暂无评论