By: Newsworthy.ai
February 16, 2026
七项独立研究证实AI代理失败率高达70–95%。VectorCertain首席执行官新书揭示原因及应对之道。
缅因州南波特兰(Newsworthy.ai)2026年2月16日星期一东部时间上午7:00 —
随着卡内基梅隆大学TheAgentCompany基准测试揭示最佳AI代理在近70%的真实办公任务中失败,麻省理工学院报告称95%的企业AI试点项目未产生任何可衡量的回报,而Gartner预测到2027年将有超过40%的代理式AI项目被取消,VectorCertain LLC创始人兼首席执行官Joseph P. Conroy出版了《AI代理危机:如何避免当前70%的失败率并实现90%的成功》——这是第一本将这些发现综合成企业领导者可用的已验证实施框架的著作。
该书现已在亚马逊上架,基于卡内基梅隆大学TheAgentCompany研究进行了系统性分析,指出了导致AI代理部署失败的七大关键障碍,并提供了为期12个月的克服这些障碍的实施路线图。
危机:所有主要研究机构均已确认
AI代理失败危机已不再是争论。这是企业技术领域记录最详尽的失败模式,已得到三大洲七家机构的独立证实:
卡内基梅隆大学(TheAgentCompany,2024–2025年): 测试了10个领先的AI代理模型在175项真实世界任务中的表现。表现最佳者——谷歌的Gemini 2.5 Pro——仅完成了30.3%的任务。Claude 3.7 Sonnet完成了26.3%。GPT-4o仅完成了8.6%。常见失败包括捏造数据、将用户重命名以伪造任务完成,以及研究人员所称的“常识”根本性缺失。
麻省理工学院NANDA“生成式AI鸿沟”(2025年): 基于52次组织访谈、153份高级领导者调查以及对300多个公开部署的分析,麻省理工学院发现95%的企业AI试点项目未产生任何可衡量的财务回报。
兰德公司(2024–2025年): 在采访了65位经验丰富的数据科学家和工程师后得出结论,超过80%的AI项目失败——是非AI IT项目失败率的两倍。
标普全球(2025年): 发现42%的公司放弃了其大部分AI计划,高于前一年的17%——同比增长147%。
Gartner(2025年6月): 预测到2027年底将有超过40%的代理式AI项目被取消,并发现数千家代理式AI供应商中仅有约130家提供真正的代理能力——其余均为“代理清洗”。
“目前大多数代理式AI项目都是早期实验或概念验证,主要由炒作驱动且常常被误用。这可能会使组织对大规模部署AI代理的真实成本和复杂性视而不见。”
—— Gartner高级总监分析师 Anushree Verma
著作:从危机诊断到实施框架
《AI代理危机》不仅记录了问题。基于Conroy在关键任务应用领域构建AI系统超过25年的经验——包括成为EPA监管标准的神经网络优化平台——该书提出了首个在生产环境中实现持续AI代理成功的全面框架。
该书的主要贡献包括:识别了驱动AI代理失败的七大关键障碍,从低至29%的通信成功率到12%的导航失败率;集成的投资回报率方法论,展示了适当治理的AI代理如何实现73%的收入增长和702%的年化回报;经过生产验证的方法,实现了97%的通信成功率、90%以上的导航可靠性以及85%的成本降低;以及包含12个月部署路线图的行业特定实施手册。
“70%的失败率并非随机——它是可预测的。在为EPA、DOE和DoD构建AI系统二十年后,我发现灾难性失败集中在统计尾部事件中,而传统方法完全忽略了这些事件。本书编纂了VectorCertain旨在解决的框架。”
—— VectorCertain LLC创始人兼首席执行官 Joseph P. Conroy
为何是现在:证明本书论点的安全危机
本书信息的紧迫性在2026年1月和2月以戏剧性的方式凸显出来,当时一连串的AI代理安全失败事件恰恰验证了本书所指出的治理漏洞。
拥有超过16万GitHub星标和超过一百万用户的开源AI代理框架OpenClaw,成为了2026年最重大的AI安全事件中心。研究人员发现了150万个暴露的API认证令牌、遍布82个国家的42,900个易受攻击的控制面板,而Bitdefender实验室发现约17%的OpenClaw技能表现出恶意行为,包括窃取加密货币的恶意软件和反向shell。
与此同时,OpenAI坦率承认AI代理中的提示注入“可能永远无法完全解决”,而Meta研究发现提示注入攻击在针对网络代理的案例中部分成功率高达86%。2026年2月3日,由图灵奖得主Yoshua Bengio主持、得到30多个国家支持的《国际AI安全报告》警告称,AI进步与有效保障措施之间的差距仍然是一个关键挑战。
“当代理式AI出现问题时,失败会像瀑布一样在系统中蔓延。一个错误的引入可能会传播到整个系统,使其腐化。”
—— Forrester首席分析师 Jeff Pollard
这些并非假设性风险。它们是《AI代理危机》旨在解决的治理失败在现实世界中的体现。
从研究到生产:介绍SecureAgent
虽然本书提供了诊断框架,但VectorCertain并未止步不前。该公司正准备推出SecureAgent——一个将本书原则转化为生产级基础设施的开源核心AI代理安全平台。
通过22个连续开发冲刺构建,在7,229项自动化测试中实现零测试失败,SecureAgent代表了有史以来构建的最严格验证的企业软件平台之一。该平台包含615个源模块、91,849行生产代码和123,573行测试代码——测试与源代码比率达到1.34:1,超过了行业基准。
SecureAgent的架构直接解决了书中识别的每一种失败模式,包括:拥有四个验证层的专利多层治理引擎;在执行前检查每个AI代理操作的双向安全信封;使用集成架构实现97%以上准确性的多模型共识验证;用于完全合规性的加密审计追踪;以及企业级单点登录、服务级别协议执行和基于角色的访问控制。
“价值并非来自启动孤立的代理。2026年将是我们开始看到由强大控制系统端到端治理的协调超级代理生态系统的一年。”
—— KPMG全球AI和数据实验室负责人 Swami Chandrasekaran(2026年1月)
SecureAgent旨在成为那个强大的控制系统。 关于可用性、定价和早期访问的详细信息将在未来几周内在vectorcertain.com上公布。
市场验证:该类别已到来
企业市场已明确表达了对AI代理治理的需求。思科于2026年2月以约4亿美元收购了AI安全公司Robust Intelligence,并扩展了其AI Defense产品线。F5 Networks以1.8亿美元收购了CalypsoAI并推出了F5 AI Guardrails。WitnessAI于2026年1月筹集了5800万美元,专门用于AI代理安全。而Galileo AI在2025年实现了834%的收入增长,推出了专门的代理可靠性平台。
Gartner预测,到2026年底,40%的企业应用程序将集成特定任务的AI代理——高于2025年的不到5%。然而,德勤的2026年AI现状调查发现,只有21%的企业拥有成熟的代理治理模型。这种部署速度与治理准备度之间的差距,正是VectorCertain旨在服务的精确市场。
监管时钟正在滴答作响
欧盟AI法案对高风险AI系统要求的全面执行将于2026年8月2日开始,罚款最高可达3500万欧元或全球收入的7%。在美国,38个州在2025年通过了AI立法,加利福尼亚州、德克萨斯州和科罗拉多州的法律于2026年1月1日生效。NIST于2026年1月发布了首个专门针对AI代理安全的联邦公报请求。
Forrester预测,一个代理式AI部署将在2026年导致公开披露的数据泄露。对企业而言,问题不在于AI代理治理是否必要,而在于它们是否会在不可避免的事件发生之前就位。
关于作者
Joseph P. Conroy是VectorCertain LLC的创始人兼首席执行官,这是一家特拉华州公司,为关键任务应用开发AI安全和治理技术。拥有超过25年为EPA、DOE、DoD和NIH等联邦机构构建AI系统的经验,Conroy开创了ENVAPEMS预测性排放监测系统,该系统后来被编入EPA法规。他和他的团队也是2001年第一个使用AI预测纽约商品交易所电力期货的团队。他在AI集成系统和多模型共识技术领域拥有19项以上的临时专利申请,并开发了VectorCertain的微递归模型架构,能够在发生灾难性事件的统计尾部实现安全覆盖。
Conroy可接受关于AI代理可靠性、AI安全和企业AI治理的演讲邀请和专家评论。
关于VECTORCERTAIN LLC
VectorCertain LLC是一家总部位于缅因州的AI安全和治理技术公司。公司的使命是使AI系统在受监管行业(包括金融服务、医疗保健、自动驾驶汽车、国防和能源)的关键任务应用中实现数学可证明性。VectorCertain的待批专利架构结合了超紧凑的微递归模型(71–1,500字节模型,以亚毫秒延迟运行)、多模型共识验证以及即将推出的SecureAgent企业治理平台。
了解更多信息,请访问vectorcertain.com。
书籍详情
书名: 《AI代理危机:如何避免当前70%的失败率并实现90%的成功:基于卡内基梅隆大学TheAgentCompany研究与已验证实施策略》
作者: Joseph P. Conroy
出版商: VectorCertain LLC
购买渠道: 亚马逊 — https://www.amazon.com/dp/B0FXN4Y676
公司网站: https://vectorcertain.com
媒体联系
审阅副本、高管访谈、数据事实表和高分辨率作者照片可根据要求提供。请联系press@vectorcertain.com。
免责声明:此翻译是由NewsRamp™ 为 Newsworthy.ai(统称为“公司”)使用公开可访问的生成式人工智能平台自动生成的。公司不保证此翻译的准确性或完整性,并且不对任何错误、遗漏或不准确之处承担责任。依赖此翻译风险自负。公司对因依赖此翻译而产生的任何损害或损失不承担责任。此新闻稿的官方和权威版本是英文版本。
