在人工智能編程助手這一賽道,一場激烈的排位賽正在上演。最新數據顯示,OpenAI的編程助手Codex在部分核心能力上已超越Anthropic的Claude Code。
10月9日,據初創公司Modu收集的超過30萬個代碼拉取請求的數據顯示,開發者對Codex生成的代碼批準率達到了74.3%,略高于Claude Code的73.7%。
這一數據得到了市場的側面印證,過去一個月,在X和Reddit等社交平臺上,已有開發者注意到Codex性能的顯著改善。

分析認為,這一逆轉主要歸功于OpenAI上月發布的GPT-5-Codex模型。據Modu聯合創始人Brexton Pham透露,在該模型發布前,OpenAI舊版Codex的代碼成功率僅為69%。新模型的推出,成為OpenAI在此次競賽中扳回一城的關鍵。
對于Anthropic而言,贏得編碼競賽似乎是意義重大的。據《The Information》報道,該公司的收入主要來自通過API向微軟等客戶銷售其AI模型,而編碼技術是其收入的驅動核心。
相比之下,擁有ChatGPT這一商業巨擘的OpenAI對編碼業務的收入依賴較小,但其領導層將編碼視為開發通用人工智能(AGI)的“關鍵齒輪”,并于去年加倍投入以提升其模型的編碼能力。
性能領先,但用戶習慣仍是挑戰
盡管在代碼生成質量上取得了微弱優勢,但Codex在吸引開發者使用方面仍面臨巨大挑戰。數據顯示,在開發者最終合并的代碼請求中,使用Codex創建的比例為24.9%,而Claude Code則為32.1%。
不過,Brexton Pham指出,相較于新模型發布前,Codex的市場份額已提升了五個百分點,顯示出增長勢頭。
然而,從另一個維度看,差距依然懸殊。根據軟件注冊表NPM的數據,Claude Code目前的周下載量超過500萬次,而Codex僅為19萬次。
這表明,要將性能優勢轉化為市場主導地位,OpenAI仍有很長的路要走,改變開發者的使用習慣將是其面臨的主要障礙。
市場競爭激烈,成本非決定因素
有趣的是,成本似乎并未成為開發者選擇工具的首要因素。Brexton Pham表示,盡管Codex比Claude Code更便宜,但開發者目前愿意為高性能產品支付更高價格,因為他們普遍預計長期來看成本會下降。對于企業決策者而言,投資AI編程助手以提升現有工程師效率,遠比招聘更多人力工程師的成本要低。
此外,AI編碼市場并非只有兩家巨頭。Modu的數據揭示了一些“黑馬”的存在。例如,Sourcegraph公司的Amp agent以76.8%的批準率成為代碼最受開發者認可的助手。Brexton Pham將其形容為市場上的“精品奢侈”產品,即價格更高但性能更優。
與此同時,谷歌的Gemini CLI則憑借其一貫的低價策略,成為目前最便宜的編碼助手。值得注意的是,Modu的基準測試尚未包含GitHub Copilot和谷歌的Jules agent等重要產品,這意味著整個市場的競爭版圖仍有待完整呈現。