Anthropic Blog2026年5月16日

新基准测试显示Claude Mythos和GPT-5.5可自主开发真实浏览器漏洞利用

一项新的基准测试显示，先进的AI模型Claude Mythos和GPT-5.5能够自主开发真实存在的浏览器漏洞利用代码。这突显了AI在网络安全领域的能力已达到新高度，引发了关于AI潜在风险与伦理的讨论。

发生了什么

该基准测试评估了AI模型自主发现并编写浏览器安全漏洞利用代码的能力。结果表明，Claude Mythos和GPT-5.5这类大语言模型，可以在没有人工干预的情况下，生成功能性、可利用的攻击代码。

为什么重要

这一发现至关重要，因为它展示了AI在网络安全攻击领域的巨大潜力，可能被用于恶意目的。同时，它也引发了关于AI安全、伦理规范以及开发更强大AI系统时所需保障措施的紧急讨论，对未来的网络安全防御和AI治理构成挑战。

相关背景

随着大语言模型能力的飞速提升，其在代码生成、逻辑推理等方面展现出强大实力。此前已有研究显示AI能发现软件漏洞，但本次测试将其提升到了“自主开发完整漏洞利用链”的新阶段，这标志着AI在复杂、现实世界任务中的能力边界再次被拓宽。

Claude MythosGPT-5.5网络安全漏洞利用AI安全基准测试AnthropicOpenAI

阅读原文 ↗