GPT-5 Codex与Claude Code,谁才是机械码皇?
近日OpenAI发布GPT-5 Codex,向AI辅助编程工具的王者Claude Code发起挑战。氛围编程的王座要易主了吗?
Codex 是一款 高度智能化的AI编程代理,可自动执行与编程相关的任务。你可以将复杂的任务/想法委托给 Codex,并观察它为你执行代码。
OpenAI此举被视为OpenAI在AI编程辅助工具领域,对主要竞争对手Anthropic旗下产品Claude发起的直接挑战和全面总攻,预示着该赛道的市场竞争将进一步白热化。
据了解,此次更新将覆盖包括集成开发环境(IDE)插件、终端(Terminal)及网页版在内的所有Codex应用。OpenAI方面表示,新模型在处理真实世界的编程任务上取得了显著进展。
性能指标提升,旨在解决真实世界软件工程问题
根据OpenAI在其官方博客中公布的数据,GPT-5 Codex模型在一项名为“SWE-bench Verified”的权威基准测试中,取得了74.5%的成功率(下图)。该基准旨在评估AI模型解决真实世界中复杂软件工程问题的能力,这一成绩标志着其在代码生成的实用性和可靠性上迈出了重要一步。

此外,新模型在代码重构(Refactoring)方面的能力也获得了大幅提升。数据显示,相较于通用的GPT-5模型在此项评估中33.9%的得分,GPT-5 Codex的得分跃升至51.3%。代码重构是软件开发人员优化和维护现有代码库的核心工作之一,该能力的增强意味着AI工具正从单纯的代码生成,向更深层次的代码理解与优化演进。
但是,据开发人员反馈,到目前为止,Codex在实际应用中与 Claude Code 相比还有点差距。
战略升级:从代码辅助工具到“AI代理”
值得注意的是,OpenAI在此次更新中强调了Codex作为“AI代理(AI agent)”的新定位。
与传统的代码补全或函数生成工具不同,新的Codex允许开发者将一个完整的、复杂的编程任务“委托”给AI,并观察其自主执行代码、进行调试直至完成任务。这一模式旨在将开发者从繁琐的底层代码实现中解放出来,更专注于系统设计和功能创新。
同时,OpenAI还提出了“Vibe Code”的概念,允许即便是非编程专业的用户通过自然语言描述应用的功能和“感觉”,由AI完成具体的代码开发。这被看作是OpenAI持续推动AI技术平民化、降低软件开发门槛的又一重要举措。
AI编程市场格局再生变数
在过去一年中,由前OpenAI员工创立的Anthropic公司所推出的Claude系列模型,凭借其强大的长文本处理能力和对复杂代码库的深度理解,在专业开发者社区中获得了极高的声誉,被认为是AI编程领域的市场领先者。
许多开发者反馈,Claude在理解项目上下文、进行代码审查和提供架构建议方面表现优异,更像一个经验丰富的“结对编程”伙伴。
此次OpenAI推出性能指标大幅提升的GPT-5 Codex,其战略意图十分明确,即凭借其在模型底层技术上的优势,重新夺回在专业AI编程领域的领导地位。
目前,GPT-5 Codex正在分阶段向用户推送,即便是付费订阅用户也可能需要数日才能获得更新。业内人士分析,随着两大AI巨头在编程辅助工具领域的竞争不断深化,未来开发者将能获得功能更强大、效率更高的编程工具,同时也将深刻改变软件行业的传统工作流和开发范式。
参考链接:
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: