数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

OpenAI推出GPT-5.3-Codex:基准测试创新高,成开发者协作新利器

2026-02-06来源:互联网编辑:瑞雪

OpenAI 正式推出新一代编程模型 GPT-5.3-Codex,宣称其在编程能力与开发者协作体验上实现重大突破。该模型在多项基准测试中刷新纪录,同时支持任务执行过程中的实时交互,标志着人工智能从单一编程工具向通用计算机协作者转型。

在性能测试中,GPT-5.3-Codex展现出显著提升。SWE-bench Pro(公开版)测试显示其得分达56.8%,较前代56.4%微幅增长;Terminal-Bench 2.0测试中,成绩从64.0%跃升至77.3%;最引人注目的是OSWorld-Verified智能体计算机操作测试,得分从38.2%飙升至64.7%,证明其在复杂系统环境中的操作能力实现质的飞跃。官方特别强调,新模型运行速度较GPT-5.2-Codex提升25%,在保持精度的同时显著优化效率。

开发者协作模式迎来革命性升级。新模型支持用户在任务执行过程中随时介入引导,通过高频进度更新实现双向对话。开发者可实时提问、调整方案或修正方向,系统能够完整保留上下文信息,避免传统交互中常见的断层问题。这种设计使Codex从被动执行工具转变为具备主动协作能力的智能伙伴,大幅降低应用开发的技术门槛。

技术实现层面,OpenAI重构了模型的任务处理架构。通过动态上下文管理机制,系统在保持长序列记忆能力的同时,实现多轮交互的精准响应。在代码生成测试中,新模型展现更强的环境适应能力,能够根据开发者反馈动态优化输出策略,在复杂项目开发中表现出更强的稳定性。

产品落地方面,GPT-5.3-Codex已全面开放给ChatGPT付费用户,覆盖Plus、Team及Enterprise等订阅层级。用户可通过Codex专用应用、命令行工具、IDE扩展插件及网页端四种方式访问,API接口计划于近期上线。这种多端协同的部署策略,使不同技术背景的开发者都能找到适合的接入方式。

行业观察人士指出,该模型的突破在于重新定义了AI与开发者的协作边界。通过将编程任务分解为可交互的模块化流程,GPT-5.3-Codex使非专业开发者也能参与复杂系统开发,这可能引发软件开发领域的范式转变。随着API接口的开放,预计将催生大量基于该模型的垂直领域应用。

苹果新品来袭!iPad 12升级A18芯片,iPhone 17e同期亮相有何新变化?
IT之家 2 月 6 日消息,据外媒 Mac Otakara 报道,苹果 iPad 12 和 iPhone 17e 预计将同期登场,该机外观将与iPad 11 基本一致,但会升级为 A18 芯片以支持 Ap…

2026-02-06

国家超算互联网郑州核心节点试运行 国产最大AI算力池3万卡同步上线
IT之家 2 月 5 日消息,据中科曙光消息,2 月 5 日,国家超算互联网应用技术大会暨核心节点上线试运行仪式在河南郑州举行。由中科曙光提供的 3 套万卡超集群系统在国家超算互联网郑州核心节点同时上线试运…

2026-02-06

特斯拉重启光伏面板背后:借生态闭环之力,掘金住宅能源市场
没错,早在2016年,特斯拉就收购了Solarcity,推出了太阳能屋顶(solarroof),这款产品会和特斯拉的Powerwall储能电池配合使用。 Powerwall在美国的市占率很高,超过30%,甚…

2026-02-06

黄仁勋驳斥AI取代软件论:现有软件生态为AI发展筑牢根基
据The BusinessTimes报道,针对近期市场流传的“人工智能将取代软件及相关工具”的担忧,英伟达CEO黄仁勋近日在旧金山出席思科主办的AI会议时明确驳斥,称这一观点“不合逻辑”,时间将予以验证。 …

2026-02-06