GPT-5 Codex与Claude Code，谁才是机械码皇？

作者： GoUpSec
2025年09月17日
人工智能, 动态

近日OpenAI发布GPT-5 Codex，向AI辅助编程工具的王者Claude Code发起挑战。氛围编程的王座要易主了吗？

Codex 是一款高度智能化的AI编程代理，可自动执行与编程相关的任务。你可以将复杂的任务/想法委托给 Codex，并观察它为你执行代码。

OpenAI此举被视为OpenAI在AI编程辅助工具领域，对主要竞争对手Anthropic旗下产品Claude发起的直接挑战和全面总攻，预示着该赛道的市场竞争将进一步白热化。

据了解，此次更新将覆盖包括集成开发环境（IDE）插件、终端（Terminal）及网页版在内的所有Codex应用。OpenAI方面表示，新模型在处理真实世界的编程任务上取得了显著进展。

性能指标提升，旨在解决真实世界软件工程问题

根据OpenAI在其官方博客中公布的数据，GPT-5 Codex模型在一项名为“SWE-bench Verified”的权威基准测试中，取得了74.5%的成功率（下图）。该基准旨在评估AI模型解决真实世界中复杂软件工程问题的能力，这一成绩标志着其在代码生成的实用性和可靠性上迈出了重要一步。

此外，新模型在代码重构（Refactoring）方面的能力也获得了大幅提升。数据显示，相较于通用的GPT-5模型在此项评估中33.9%的得分，GPT-5 Codex的得分跃升至51.3%。代码重构是软件开发人员优化和维护现有代码库的核心工作之一，该能力的增强意味着AI工具正从单纯的代码生成，向更深层次的代码理解与优化演进。

但是，据开发人员反馈，到目前为止，Codex在实际应用中与 Claude Code 相比还有点差距。

战略升级：从代码辅助工具到“AI代理”

值得注意的是，OpenAI在此次更新中强调了Codex作为“AI代理（AI agent）”的新定位。

与传统的代码补全或函数生成工具不同，新的Codex允许开发者将一个完整的、复杂的编程任务“委托”给AI，并观察其自主执行代码、进行调试直至完成任务。这一模式旨在将开发者从繁琐的底层代码实现中解放出来，更专注于系统设计和功能创新。

同时，OpenAI还提出了“Vibe Code”的概念，允许即便是非编程专业的用户通过自然语言描述应用的功能和“感觉”，由AI完成具体的代码开发。这被看作是OpenAI持续推动AI技术平民化、降低软件开发门槛的又一重要举措。

AI编程市场格局再生变数

在过去一年中，由前OpenAI员工创立的Anthropic公司所推出的Claude系列模型，凭借其强大的长文本处理能力和对复杂代码库的深度理解，在专业开发者社区中获得了极高的声誉，被认为是AI编程领域的市场领先者。

许多开发者反馈，Claude在理解项目上下文、进行代码审查和提供架构建议方面表现优异，更像一个经验丰富的“结对编程”伙伴。

此次OpenAI推出性能指标大幅提升的GPT-5 Codex，其战略意图十分明确，即凭借其在模型底层技术上的优势，重新夺回在专业AI编程领域的领导地位。

目前，GPT-5 Codex正在分阶段向用户推送，即便是付费订阅用户也可能需要数日才能获得更新。业内人士分析，随着两大AI巨头在编程辅助工具领域的竞争不断深化，未来开发者将能获得功能更强大、效率更高的编程工具，同时也将深刻改变软件行业的传统工作流和开发范式。

参考链接：

https://openai.com/index/introducing-upgrades-to-codex


第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom


   除非注明，本站文章均为原创或编译，未经许可严禁转载。


相关文章：


                    Anthropic推出最强推理模型Claude 3.7 Sonnet，编程能力碾压Deepseek
                                      AI再次突破安全红线，留给人类不到一年治理窗口
                                      ChatGPT与Gemini谁更适合网络安全运营？
                                      谷歌Gemini真的遥遥领先了吗？
                                      顶流人工智能距离“通用”还很遥远
                                      GitHub人气最高的20个网络安全GPTs
                                      OpenAI乱局梳理，谁是最大赢家？
                                      顶尖大语言模型横向评测，ChatGPT完胜
                  



标签： AI编程, chatGPT, claude, 氛围编程