AI 助力漏洞挖掘：Anthropic 开源框架实战

标签：AI、CyberSecurity、OpenSource、VulnerabilityDetection

过去两年，AI 在软件开发领域最受关注的应用之一是代码生成。但在安全社区，另一条同样重要的路线正在迅速升温：让 AI 成为漏洞研究员。

最近，Anthropic 开源了用于 AI 驱动漏洞发现的框架 Defending Code Reference Harness，引发 Hacker News 社区热烈讨论，获得超过 400 点赞和上百条评论[1]。与此前各种“AI 会自动找到所有漏洞”的营销叙事不同，这个项目吸引开发者和安全研究人员的原因在于，它展示了一套更加工程化、可复用的漏洞挖掘工作流。

从某种意义上说，这个项目的流行并不只是因为 Anthropic 本身，而是因为它恰好踩中了当前 AI 安全研究最重要的发展趋势：从模型能力展示，转向实际安全生产力工具。

从聊天机器人到漏洞研究助手

长期以来，漏洞发现主要依赖以下几种方式：

人工代码审计
模糊测试（Fuzzing）
静态分析
动态分析
安全研究员经验驱动的探索

这些方法各有优势，但都存在明显瓶颈。

例如人工审计效率有限；静态分析工具误报较多；Fuzzing 对输入空间覆盖能力有限；而高级安全研究员又十分稀缺。

大语言模型的出现带来了新的可能性。

与传统规则引擎不同，LLM 能够：

理解复杂代码逻辑
建立跨文件上下文关联
推断开发者意图
识别潜在攻击面
自动生成测试思路

这意味着 AI 不再只是“发现语法错误”，而是开始具备一定程度的安全推理能力。

Anthropic 的开源框架正是围绕这一能力构建。

这个开源框架究竟做了什么？

从项目设计来看，它并不是一个简单的“输入代码，输出漏洞”的工具。

更准确地说，它是一个用于组织 AI Agent 执行漏洞研究任务的基础设施。

框架负责：

任务编排

AI Agent 会被赋予目标，例如：

分析代码库
寻找攻击入口
推测潜在漏洞类型
编写验证脚本

而不是单次问答。

工具调用

Agent 可以结合：

代码搜索
文件浏览
Shell 命令
测试运行

等能力进行探索。

这种模式更接近真实安全研究员的工作流程。

多轮推理

漏洞发现往往需要：

阅读代码
形成假设
编写验证
获取结果
修正假设

框架支持这种持续循环。

这也是当前 Agent 系统与传统 Prompt Engineering 的核心区别。

为什么 Hacker News 如此关注？

如果只看功能描述，这类项目其实并不少见。

真正引发讨论的是它所代表的行业变化。

趋势一：漏洞研究正在被 Agent 化

过去几年，大多数 AI 安全演示都集中于：

漏洞分类
CVE 分析
安全问答

而现在焦点开始转向：

如何让 AI 自主完成完整漏洞发现流程。

这意味着研究目标发生了变化。

过去关注模型是否懂漏洞。

现在关注模型是否能像研究员一样工作。

Anthropic 的项目正是这种转变的典型案例。

趋势二：安全工具开始进入“框架时代”

Hacker News 用户 tptacek 给出了一个颇具代表性的评价：

这类东西更像木工车间里的夹具（shop jig）。以前构建这样的系统成本很高，而今天更好的做法是参考它的设计思路，然后根据自己的工作流定制一套系统。[1]

这个观点获得不少认同。

原因在于：

AI 模型能力正在快速商品化。

真正形成差异化竞争的，不再是模型本身，而是：

工作流设计
Agent 协作机制
工具集成方式
告警与验证流程

换句话说：

未来安全团队的竞争优势，很可能来自自己构建的漏洞发现流水线，而非使用哪个模型。

这也是为什么很多评论者把该项目视为参考架构，而不是最终产品。

趋势三：开源正在加速安全 AI 普及

如果回到 2023 年，大多数 AI 安全研究都集中在少数大公司内部。

原因很简单：

成本太高。

工程门槛太高。

实验环境搭建复杂。

如今情况已经发生变化。

随着：

Claude
GPT
Gemini
开源推理模型

能力持续提升，构建 Agent Harness 的难度明显下降。

Anthropic 将自身实践公开后，许多团队都可以直接借鉴其架构设计。

这种开放性推动了整个生态的发展。

社区最关心的问题：成本

有趣的是，讨论区最受关注的话题之一并非漏洞本身，而是运行成本。

知名开发者 Simon Willison 在评论中提到，按照项目文档中的 Token 消耗估算：

每个 Agent 每分钟约消耗 1 万输入 Token
输出约 2000 Token
可以并行运行多个 Agent

他推测，如果使用高性能模型，运行成本可能达到数百甚至数千美元。[1]

这揭示了当前 AI 漏洞研究面临的现实挑战。

AI 已经足够聪明

很多实验表明：

LLM 确实能发现部分真实漏洞。

这一点越来越少有人怀疑。

但规模化仍然昂贵

真正的问题变成：

是否值得持续运行。

例如：

审计一个中型代码仓库。

可能需要：

数小时分析
多个 Agent 并行
多轮验证

成本很快超过传统静态分析工具。

因此短期来看，AI 更可能承担：

高价值代码审计
关键系统检查
漏洞研究辅助

而非完全替代现有安全扫描体系。

对开发者意味着什么？

对于普通开发者而言，这类项目最重要的启示并不是“以后不需要安全工程师了”。

恰恰相反。

AI 正在成为安全工作的放大器

评论区有安全从业者指出：

这是一个能够帮助漏洞猎人节省时间的优秀辅助工具。[1]

这种定位可能更加准确。

AI 擅长：

快速阅读大量代码
总结模块关系
提出潜在线索

而人类仍然负责：

判断风险真实性
设计攻击路径
评估影响范围

二者形成互补。

安全能力正在向开发阶段前移

传统流程往往是：

开发 → 测试 → 安全审计

未来可能变成：

开发 → AI 持续审计 → 测试 → 上线

漏洞发现将更早发生。

这与近年来流行的 DevSecOps 理念高度一致。

Agent 工程能力将成为新技能

从这个项目可以看到：

未来安全工程师不仅需要理解漏洞原理。

还需要理解：

Agent 设计
Prompt 策略
工具链编排
自动验证机制

安全研究与 AI 工程正在快速融合。

开源漏洞研究框架的真正价值

从技术角度看，Anthropic 的开源项目未必会成为所有团队直接使用的标准方案。

但它的重要意义在于：

它展示了当前最先进 AI 安全研究工作流的实现方式。

正如 Hacker News 评论所指出的那样，这更像一个“参考夹具”而非最终产品。[1]

开发者真正能获得的价值包括：

学习 Agent 漏洞研究架构
理解 AI 安全自动化流程
构建适合自身团队的审计系统
探索 AI 与传统安全工具结合方式

这些经验比单纯运行一个工具更有长期价值。

总结

Anthropic 开源 AI 漏洞发现框架之所以能够迅速登上 Hacker News 热榜，并不是因为它首次实现了 AI 找漏洞，而是因为它反映了一个更大的行业趋势：AI 安全研究正在从模型能力展示走向工程化落地。

在这一过程中，我们看到几个关键变化：

漏洞研究开始 Agent 化；
安全工具进入工作流竞争阶段；
开源正在降低 AI 安全研究门槛；
成本与效率成为新的核心议题。

对于开发者和安全团队而言，未来最值得关注的或许不是哪个模型最强，而是谁能够把模型、工具和流程组合成真正有效的漏洞发现系统。

当 AI 成为安全研究员的“副驾驶”，软件安全领域的工作方式，已经开始发生改变。

参考资料

[1] Hacker News 讨论：《Anthropic’s open-source framework for AI-powered vulnerability discovery》，Story ID: 48403980，2026-06-04。
[2] Anthropic 开源项目：Defending Code Reference Harness（GitHub）。