AI 助力漏洞挖掘:Anthropic 开源框架实战

AI 助力漏洞挖掘:Anthropic 开源框架实战

标签:AI、CyberSecurity、OpenSource、VulnerabilityDetection

过去两年,AI 在软件开发领域最受关注的应用之一是代码生成。但在安全社区,另一条同样重要的路线正在迅速升温:让 AI 成为漏洞研究员。

最近,Anthropic 开源了用于 AI 驱动漏洞发现的框架 Defending Code Reference Harness,引发 Hacker News 社区热烈讨论,获得超过 400 点赞和上百条评论[1]。与此前各种“AI 会自动找到所有漏洞”的营销叙事不同,这个项目吸引开发者和安全研究人员的原因在于,它展示了一套更加工程化、可复用的漏洞挖掘工作流。

从某种意义上说,这个项目的流行并不只是因为 Anthropic 本身,而是因为它恰好踩中了当前 AI 安全研究最重要的发展趋势:从模型能力展示,转向实际安全生产力工具。

从聊天机器人到漏洞研究助手

长期以来,漏洞发现主要依赖以下几种方式:

  • 人工代码审计
  • 模糊测试(Fuzzing)
  • 静态分析
  • 动态分析
  • 安全研究员经验驱动的探索

这些方法各有优势,但都存在明显瓶颈。

例如人工审计效率有限;静态分析工具误报较多;Fuzzing 对输入空间覆盖能力有限;而高级安全研究员又十分稀缺。

大语言模型的出现带来了新的可能性。

与传统规则引擎不同,LLM 能够:

  • 理解复杂代码逻辑
  • 建立跨文件上下文关联
  • 推断开发者意图
  • 识别潜在攻击面
  • 自动生成测试思路

这意味着 AI 不再只是“发现语法错误”,而是开始具备一定程度的安全推理能力。

Anthropic 的开源框架正是围绕这一能力构建。

这个开源框架究竟做了什么?

从项目设计来看,它并不是一个简单的“输入代码,输出漏洞”的工具。

更准确地说,它是一个用于组织 AI Agent 执行漏洞研究任务的基础设施。

框架负责:

任务编排

AI Agent 会被赋予目标,例如:

  • 分析代码库
  • 寻找攻击入口
  • 推测潜在漏洞类型
  • 编写验证脚本

而不是单次问答。

工具调用

Agent 可以结合:

  • 代码搜索
  • 文件浏览
  • Shell 命令
  • 测试运行

等能力进行探索。

这种模式更接近真实安全研究员的工作流程。

多轮推理

漏洞发现往往需要:

  1. 阅读代码
  2. 形成假设
  3. 编写验证
  4. 获取结果
  5. 修正假设

框架支持这种持续循环。

这也是当前 Agent 系统与传统 Prompt Engineering 的核心区别。

为什么 Hacker News 如此关注?

如果只看功能描述,这类项目其实并不少见。

真正引发讨论的是它所代表的行业变化。

趋势一:漏洞研究正在被 Agent 化

过去几年,大多数 AI 安全演示都集中于:

  • 漏洞分类
  • CVE 分析
  • 安全问答

而现在焦点开始转向:

如何让 AI 自主完成完整漏洞发现流程。

这意味着研究目标发生了变化。

过去关注模型是否懂漏洞。

现在关注模型是否能像研究员一样工作。

Anthropic 的项目正是这种转变的典型案例。

趋势二:安全工具开始进入“框架时代”

Hacker News 用户 tptacek 给出了一个颇具代表性的评价:

这类东西更像木工车间里的夹具(shop jig)。以前构建这样的系统成本很高,而今天更好的做法是参考它的设计思路,然后根据自己的工作流定制一套系统。[1]

这个观点获得不少认同。

原因在于:

AI 模型能力正在快速商品化。

真正形成差异化竞争的,不再是模型本身,而是:

  • 工作流设计
  • Agent 协作机制
  • 工具集成方式
  • 告警与验证流程

换句话说:

未来安全团队的竞争优势,很可能来自自己构建的漏洞发现流水线,而非使用哪个模型。

这也是为什么很多评论者把该项目视为参考架构,而不是最终产品。

趋势三:开源正在加速安全 AI 普及

如果回到 2023 年,大多数 AI 安全研究都集中在少数大公司内部。

原因很简单:

成本太高。

工程门槛太高。

实验环境搭建复杂。

如今情况已经发生变化。

随着:

  • Claude
  • GPT
  • Gemini
  • 开源推理模型

能力持续提升,构建 Agent Harness 的难度明显下降。

Anthropic 将自身实践公开后,许多团队都可以直接借鉴其架构设计。

这种开放性推动了整个生态的发展。

社区最关心的问题:成本

有趣的是,讨论区最受关注的话题之一并非漏洞本身,而是运行成本。

知名开发者 Simon Willison 在评论中提到,按照项目文档中的 Token 消耗估算:

  • 每个 Agent 每分钟约消耗 1 万输入 Token
  • 输出约 2000 Token
  • 可以并行运行多个 Agent

他推测,如果使用高性能模型,运行成本可能达到数百甚至数千美元。[1]

这揭示了当前 AI 漏洞研究面临的现实挑战。

AI 已经足够聪明

很多实验表明:

LLM 确实能发现部分真实漏洞。

这一点越来越少有人怀疑。

但规模化仍然昂贵

真正的问题变成:

是否值得持续运行。

例如:

审计一个中型代码仓库。

可能需要:

  • 数小时分析
  • 多个 Agent 并行
  • 多轮验证

成本很快超过传统静态分析工具。

因此短期来看,AI 更可能承担:

  • 高价值代码审计
  • 关键系统检查
  • 漏洞研究辅助

而非完全替代现有安全扫描体系。

对开发者意味着什么?

对于普通开发者而言,这类项目最重要的启示并不是“以后不需要安全工程师了”。

恰恰相反。

AI 正在成为安全工作的放大器

评论区有安全从业者指出:

这是一个能够帮助漏洞猎人节省时间的优秀辅助工具。[1]

这种定位可能更加准确。

AI 擅长:

  • 快速阅读大量代码
  • 总结模块关系
  • 提出潜在线索

而人类仍然负责:

  • 判断风险真实性
  • 设计攻击路径
  • 评估影响范围

二者形成互补。

安全能力正在向开发阶段前移

传统流程往往是:

开发 → 测试 → 安全审计

未来可能变成:

开发 → AI 持续审计 → 测试 → 上线

漏洞发现将更早发生。

这与近年来流行的 DevSecOps 理念高度一致。

Agent 工程能力将成为新技能

从这个项目可以看到:

未来安全工程师不仅需要理解漏洞原理。

还需要理解:

  • Agent 设计
  • Prompt 策略
  • 工具链编排
  • 自动验证机制

安全研究与 AI 工程正在快速融合。

开源漏洞研究框架的真正价值

从技术角度看,Anthropic 的开源项目未必会成为所有团队直接使用的标准方案。

但它的重要意义在于:

它展示了当前最先进 AI 安全研究工作流的实现方式。

正如 Hacker News 评论所指出的那样,这更像一个“参考夹具”而非最终产品。[1]

开发者真正能获得的价值包括:

  • 学习 Agent 漏洞研究架构
  • 理解 AI 安全自动化流程
  • 构建适合自身团队的审计系统
  • 探索 AI 与传统安全工具结合方式

这些经验比单纯运行一个工具更有长期价值。

总结

Anthropic 开源 AI 漏洞发现框架之所以能够迅速登上 Hacker News 热榜,并不是因为它首次实现了 AI 找漏洞,而是因为它反映了一个更大的行业趋势:AI 安全研究正在从模型能力展示走向工程化落地。

在这一过程中,我们看到几个关键变化:

  • 漏洞研究开始 Agent 化;
  • 安全工具进入工作流竞争阶段;
  • 开源正在降低 AI 安全研究门槛;
  • 成本与效率成为新的核心议题。

对于开发者和安全团队而言,未来最值得关注的或许不是哪个模型最强,而是谁能够把模型、工具和流程组合成真正有效的漏洞发现系统。

当 AI 成为安全研究员的“副驾驶”,软件安全领域的工作方式,已经开始发生改变。

参考资料

[1] Hacker News 讨论:《Anthropic’s open-source framework for AI-powered vulnerability discovery》,Story ID: 48403980,2026-06-04。
[2] Anthropic 开源项目:Defending Code Reference Harness(GitHub)。