公众号手机端

OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁

zhiyongz 1小时前 阅读数 5 #人工智能
文章标签 OpenAI
快科技6月23日消息,OpenAI宣布将其Daybreak网络安全计划扩展至包含一款专门为安全研究人员和防御人员设计的AI模型GPT-5.5-Cyber,初步基准测试显示,该模型在CyberGym测试中得分85.6%,超越了Claude Mythos 5的83.8%,帮助OpenAI重夺榜首位置。
自今年3月Codex Security发布以来,该工具已分析超过30,000个代码库中的逾3亿个代码提交,识别出70,000个被人类审查者标记为已修复的问题,另有超过50万份报告被自动标记为已解决。
OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁 OpenAI 第1张
OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁
OpenAI指出,当前AI工具在发现新漏洞方面已展现出强大能力,但在漏洞评估、修复和提供安全更新方面仍存在不足,GPT-5.5-Cyber正是为此而生,它不仅能够识别漏洞,还能自主创建补丁。该AI代理可执行深度代码分析、检查变更、还原攻击路径、生成安全报告,并随后准备定制补丁供人工审查,还支持评估外部来源信息,如漏洞赏金报告、建议和票务系统,并可将结果集成到现有漏洞管理系统中。
OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁 OpenAI 第2张
OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁
CyberGym测试(网络安全评测集)得分85.6%,高于标准版GPT-5.5的81.8%和Claude Mythos 5的83.8%。
OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁 OpenAI 第3张
OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁
ExploitGym测试(考验智能体能否将已知漏洞转化为可执行的攻击代码)中,GPT-5.5-Cyber得分39.5%,而GPT-5.5仅为25.95%。SEC-Bench Pro测试(长链条漏洞挖掘)中,该模型得分69.8%,领先基础版的63.1%。
【本文结束】出处:快科技



版权声明

本站所有文章来源于本站原创或网络,如有侵权请联系删除。文章观点并不代表本站观点,请网友自行判断,如涉及投资、理财请谨慎应对!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门