AI 助力漏洞挖掘:Anthropic 开源框架实战
AI 助力漏洞挖掘:Anthropic 开源框架实战
标签:AI、CyberSecurity、OpenSource、VulnerabilityDetection
过去两年,AI 在软件开发领域最受关注的应用之一是代码生成。但在安全社区,另一条同样重要的路线正在迅速升温:让 AI 成为漏洞研究员。
最近,Anthropic 开源了用于 AI 驱动漏洞发现的框架 Defending Code Reference Harness,引发 Hacker News 社区热烈讨论,获得超过 400 点赞和上百条评论[1]。与此前各种“AI 会自动找到所有漏洞”的营销叙事不同,这个项目吸引开发者和安全研究人员的原因在于,它展示了一套更加工程化、可复用的漏洞挖掘工作流。
从某种意义上说,这个项目的流行并不只是因为 Anthropic 本身,而是因为它恰好踩中了当前 AI 安全研究最重要的发展趋势:从模型能力展示,转向实际安全生产力工具。
从聊天机器人到漏洞研究助手
长期以来,漏洞发现主要依赖以下几种方式:
- 人工代码审计
- 模糊测试(Fuzzing)
- 静态分析
- 动态分析
- 安全研究员经验驱动的探索
这些方法各有优势,但都存在明显瓶颈。
例如人工审计效率有限;静态分析工具误报较多;Fuzzing 对输入空间覆盖能力有限;而高级安全研究员又十分稀缺。
大语言模型的出现带来了新的可能性。
与传统规则引擎不同,LLM 能够:
- 理解复杂代码逻辑
- 建立跨文件上下文关联
- 推断开发者意图
- 识别潜在攻击面
- 自动生成测试思路
这意味着 AI 不再只是“发现语法错误”,而是开始具备一定程度的安全推理能力。
Anthropic 的开源框架正是围绕这一能力构建。
这个开源框架究竟做了什么?
从项目设计来看,它并不是一个简单的“输入代码,输出漏洞”的工具。
更准确地说,它是一个用于组织 AI Agent 执行漏洞研究任务的基础设施。
框架负责:
任务编排
AI Agent 会被赋予目标,例如:
- 分析代码库
- 寻找攻击入口
- 推测潜在漏洞类型
- 编写验证脚本
而不是单次问答。
工具调用
Agent 可以结合:
- 代码搜索
- 文件浏览
- Shell 命令
- 测试运行
等能力进行探索。
这种模式更接近真实安全研究员的工作流程。
多轮推理
漏洞发现往往需要:
- 阅读代码
- 形成假设
- 编写验证
- 获取结果
- 修正假设
框架支持这种持续循环。
这也是当前 Agent 系统与传统 Prompt Engineering 的核心区别。
为什么 Hacker News 如此关注?
如果只看功能描述,这类项目其实并不少见。
真正引发讨论的是它所代表的行业变化。
趋势一:漏洞研究正在被 Agent 化
过去几年,大多数 AI 安全演示都集中于:
- 漏洞分类
- CVE 分析
- 安全问答
而现在焦点开始转向:
如何让 AI 自主完成完整漏洞发现流程。
这意味着研究目标发生了变化。
过去关注模型是否懂漏洞。
现在关注模型是否能像研究员一样工作。
Anthropic 的项目正是这种转变的典型案例。
趋势二:安全工具开始进入“框架时代”
Hacker News 用户 tptacek 给出了一个颇具代表性的评价:
这类东西更像木工车间里的夹具(shop jig)。以前构建这样的系统成本很高,而今天更好的做法是参考它的设计思路,然后根据自己的工作流定制一套系统。[1]
这个观点获得不少认同。
原因在于:
AI 模型能力正在快速商品化。
真正形成差异化竞争的,不再是模型本身,而是:
- 工作流设计
- Agent 协作机制
- 工具集成方式
- 告警与验证流程
换句话说:
未来安全团队的竞争优势,很可能来自自己构建的漏洞发现流水线,而非使用哪个模型。
这也是为什么很多评论者把该项目视为参考架构,而不是最终产品。
趋势三:开源正在加速安全 AI 普及
如果回到 2023 年,大多数 AI 安全研究都集中在少数大公司内部。
原因很简单:
成本太高。
工程门槛太高。
实验环境搭建复杂。
如今情况已经发生变化。
随着:
- Claude
- GPT
- Gemini
- 开源推理模型
能力持续提升,构建 Agent Harness 的难度明显下降。
Anthropic 将自身实践公开后,许多团队都可以直接借鉴其架构设计。
这种开放性推动了整个生态的发展。
社区最关心的问题:成本
有趣的是,讨论区最受关注的话题之一并非漏洞本身,而是运行成本。
知名开发者 Simon Willison 在评论中提到,按照项目文档中的 Token 消耗估算:
- 每个 Agent 每分钟约消耗 1 万输入 Token
- 输出约 2000 Token
- 可以并行运行多个 Agent
他推测,如果使用高性能模型,运行成本可能达到数百甚至数千美元。[1]
这揭示了当前 AI 漏洞研究面临的现实挑战。
AI 已经足够聪明
很多实验表明:
LLM 确实能发现部分真实漏洞。
这一点越来越少有人怀疑。
但规模化仍然昂贵
真正的问题变成:
是否值得持续运行。
例如:
审计一个中型代码仓库。
可能需要:
- 数小时分析
- 多个 Agent 并行
- 多轮验证
成本很快超过传统静态分析工具。
因此短期来看,AI 更可能承担:
- 高价值代码审计
- 关键系统检查
- 漏洞研究辅助
而非完全替代现有安全扫描体系。
对开发者意味着什么?
对于普通开发者而言,这类项目最重要的启示并不是“以后不需要安全工程师了”。
恰恰相反。
AI 正在成为安全工作的放大器
评论区有安全从业者指出:
这是一个能够帮助漏洞猎人节省时间的优秀辅助工具。[1]
这种定位可能更加准确。
AI 擅长:
- 快速阅读大量代码
- 总结模块关系
- 提出潜在线索
而人类仍然负责:
- 判断风险真实性
- 设计攻击路径
- 评估影响范围
二者形成互补。
安全能力正在向开发阶段前移
传统流程往往是:
开发 → 测试 → 安全审计
未来可能变成:
开发 → AI 持续审计 → 测试 → 上线
漏洞发现将更早发生。
这与近年来流行的 DevSecOps 理念高度一致。
Agent 工程能力将成为新技能
从这个项目可以看到:
未来安全工程师不仅需要理解漏洞原理。
还需要理解:
- Agent 设计
- Prompt 策略
- 工具链编排
- 自动验证机制
安全研究与 AI 工程正在快速融合。
开源漏洞研究框架的真正价值
从技术角度看,Anthropic 的开源项目未必会成为所有团队直接使用的标准方案。
但它的重要意义在于:
它展示了当前最先进 AI 安全研究工作流的实现方式。
正如 Hacker News 评论所指出的那样,这更像一个“参考夹具”而非最终产品。[1]
开发者真正能获得的价值包括:
- 学习 Agent 漏洞研究架构
- 理解 AI 安全自动化流程
- 构建适合自身团队的审计系统
- 探索 AI 与传统安全工具结合方式
这些经验比单纯运行一个工具更有长期价值。
总结
Anthropic 开源 AI 漏洞发现框架之所以能够迅速登上 Hacker News 热榜,并不是因为它首次实现了 AI 找漏洞,而是因为它反映了一个更大的行业趋势:AI 安全研究正在从模型能力展示走向工程化落地。
在这一过程中,我们看到几个关键变化:
- 漏洞研究开始 Agent 化;
- 安全工具进入工作流竞争阶段;
- 开源正在降低 AI 安全研究门槛;
- 成本与效率成为新的核心议题。
对于开发者和安全团队而言,未来最值得关注的或许不是哪个模型最强,而是谁能够把模型、工具和流程组合成真正有效的漏洞发现系统。
当 AI 成为安全研究员的“副驾驶”,软件安全领域的工作方式,已经开始发生改变。
参考资料
[1] Hacker News 讨论:《Anthropic’s open-source framework for AI-powered vulnerability discovery》,Story ID: 48403980,2026-06-04。
[2] Anthropic 开源项目:Defending Code Reference Harness(GitHub)。