![]()
整理 | 华卫
昨日,OpenAI 宣布收购了 Promptfoo 以保障其 AI 智能体的安全。这家成立于 2024 年的 AI 安全初创公司,专注于保护大语言模型免受网络攻击。OpenAI 在一篇博客文章中表示,交易完成后,Promptfoo 的技术将整合进 OpenAI Frontier,该平台是其近期推出的、供企业构建和管理 AI 智能体的平台。
而 Promptfoo 背后的故事简直令人难以置信:一位 Discord 工程师出于兴趣开发了一款 AI 安全工具。一夜之间,来自 Anthropic、亚马逊和 Shopify 的 25000 名工程师就开始使用它,这甚至在它正式发布之前。一年后,财富 500 强企业中有 25% 的公司和 100000 名工程师都在使用它。
23 个人干两年,
“收割”35 万 AI 开发者
成立仅两年的 Promptfoo 开发用于测试 AI 系统安全的开源工具,其中包括开源界面与函数库,同时帮助企业通过模拟攻击自家产品来寻找漏洞,这一过程被称为红队演练。
这家总部位于旧金山的初创公司目前拥有 23 名员工,由 Ian Webster 和 Michael D’Angelo 创立,后者曾担任身份验证公司 Smile Identity 的工程副总裁兼 AI 负责人,拥有将机器学习解决方案扩展到服务超过一亿人、覆盖数百家企业的业绩。
![]()
Michael D’Angelo
Webster 此前在 Discord 领导 LLM 工程和开发平台团队,将交付的 AI 产品扩展到 2 亿用户。他当时发现,安全行业尚未跟上时代:团队用来保障产品安全的工具,都是为另一个时代设计的。传统漏洞扫描器无法理解提示词注入,静态分析也无法识别模型向用户承诺超出其权限的内容。他得出结论:针对 AI 应用的测试基础设施,根本就不存在。
![]()
Ian Webster
于是,他利用夜晚和周末时间,自己动手打造了一个开源项目。后来,这个项目成为了 Promptfoo。
该产品的工作原理是扮演自动化攻击者。Promptfoo 平台不依赖人工渗透测试,而是通过聊天界面或 API 直接对接客户的 AI 应用,使用专门的模型与智能体模拟普通用户甚至攻击者的行为。一旦攻击成功,平台会记录结果、分析成因,并通过智能体推理循环迭代优化测试,暴露更深层的漏洞。平台针对的风险包括:提示词注入、数据泄露、模型越狱以及“应用层故障”,如 AI 系统向用户承诺无法兑现的功能、在客服查询中泄露数据库内容或在作业辅导中发表政治观点等。
Promptfoo 于 2024 年正式商业化运营,并获得 a16z 500 万美元种子轮融资。该轮融资吸引了一众知名天使投资人,包括 Shopify 首席执行官 Tobi Lütke、Discord 首席技术官 Stanislav Vishnevskiy 以及 Okta 联合创始人 Frederic Kerrest。在 2025 年 7 月,公司完成由 Insight Partners 领投、a16z 继续参投的 1840 万美元 A 轮融资。据金融数据平台 PitchBook 披露,Promptfoo 自成立以来仅融资 2300 万美元,最新一轮融资后的估值达 8600 万美元。
Webster 刚刚在 X 上称,已有超过 35 万名开发者以及超过 25% 的世界 500 强企业使用其产品。
![]()
被收购后保持开源,
还供 Anthropic 使用、捐款
本次收购的具体金额当前并未被披露,但 OpenAI 表示 Promptfoo 团队将加入 OpenAI。Promptfoo 首席执行官 Ian Webster 在一份声明中表示,“随着 AI 智能体与真实数据和系统的连接日益紧密,对其进行安全防护与验证变得比以往任何时候都更具挑战性,也更为重要。加入 OpenAI 能让我们加速推进这项工作,为构建实际落地 AI 系统的团队提供更强的安全、保障与治理能力。”
在 X 平台上,OpenAI 还发文称,此次收购将 “强化 Frontier 平台内智能体的安全测试与评估能力”。作为本次收购的一部分,OpenAI Frontier 平台将新增自动化安全测试与红队演练功能。该产品还将具备帮助企业监控变更、追踪测试过程的能力,以满足风险管控与合规要求。OpenAI 将 Frontier 定位为企业的 “AI 同事”,旨在让智能体接入生产系统、客户关系管理平台、数据仓库、内部工单工具,并执行具有实际影响的工作流程。
并且,OpenAI 承诺,Promptfoo 将在现有许可下保持开源,并继续为现有客户提供支持。该开源项目允许开发者测试各类与 AI 相关的提示词和智能体,并对比 ChatGPT、Anthropic 的 Claude、谷歌 Gemini 等大语言模型的性能。“Promptfoo 依然是开源的。我们将继续维护项目,接受捐款,支持多种供应商和模式,并为客户服务。”D'Angelo 也在昨日的 LinkedIn 帖子中表示。
在 Github 上,该项目获得了 11.3k Stars。同时,该项目拥有超过 248 名贡献者,且被包括 Anthropic、谷歌在内的全行业开发者广泛使用。
![]()
开源项目链接:https://github.com/promptfoo/promptfoo#readme
头部 AI 玩家全面加码,
安全工具集中上线
如今,OpenAI 及其竞争对手正竞相研发更先进的 AI 智能体,这些智能体可代表用户完成复杂任务,且仅需极少的人工干预。而当下,不法分子正利用类似技术寻找入侵关键网络的途径。能够自主执行数字任务的独立 AI 智能体的发展,让人们对生产力提升充满期待,也给不法分子提供了新的可乘之机,使其能够窃取敏感数据或操控自动化系统。
与此同时,每家大型 AI 开发商都正通过确保产品高效、安全,努力说服更多类型的企业为这项技术付费,但方式有所不同。
“OpenAI 收购 Promptfoo 明确表明,其致力于让企业级 AI 不仅强大,而且在规模化应用中安全可靠。” 投资机构 Insight Partners 董事总经理 Ganesh Bell 表示。Promptfoo 作为众多开发 AI 网络安全产品、用以防范黑客的初创公司之一,能够帮助大型企业在 AI 模型开发阶段发现并修复安全问题。
此外,OpenAI 也已着手为其 AI 产品和智能体加入安全功能。就在上周,该公司推出了一款旨在帮助安全团队发现并修复大型数据库漏洞的 AI 智能体 Codex Security,在宣布收购 Promptfoo 当天正式扩大开放范围。
Anthropic 则是另一种选择:依托 Claude 代码内部自研构建。2 月,Anthropic 推出了 Claude Code Security,该工具利用 Claude Opus 4.6 的强大推理能力,可扫描整个代码库,发现传统规则型扫描器常忽略的上下文依赖型漏洞,并直接生成针对性修复补丁。
https://openai.com/index/openai-to-acquire-promptfoo/
https://techcrunch.com/2026/03/09/openai-acquires-promptfoo-to-secure-its-ai-agents/
https://thenextweb.com/news/openai-acquires-promptfoo-ai-security-frontier
声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。
会议推荐
2026,AI 正在以更工程化的方式深度融入软件生产,Agentic AI 的探索也将从局部试点迈向体系化工程建设!
QCon 北京 2026 已正式启动,本届大会以“Agentic AI 时代的软件工程重塑”为核心主线,推动技术探索从「AI For What」真正落地到可持续的「Value From AI」。从前沿技术雷达、架构设计与数据底座、效能与成本、产品与交互、可信落地、研发组织进化六大维度,系统性展开深度探索。开往 2026 的 Agentic AI 专列即将启程!汇聚顶尖专家实战分享,把 AI 能力一次夯到位!
今日荐文
你也「在看」吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.