刚刚,OpenAI最强编程智能体上线ChatGPT
创始人
2025-05-17 17:06:58
0

机器之心报道

机器之心编辑部

昨天,OpenAI CEO 奥特曼预告了一项新研究,吊足了所有人的胃口。

就在刚刚,谜底揭晓!OpenAI 宣布,在 ChatGPT 中引入了 Codex 的研究预览版。

Codex 是一个云端软件工程智能体,可以并行处理多项任务,包括编写功能、解答代码库相关问题、修复 bug 以及提交拉取请求以供审核等。并且,每个任务都在其专属的云沙盒环境中运行,并预加载代码库。

Codex 背后的模型是 codex-1,它是 OpenAI o3 的一个版本,专门针对软件工程进行了优化。它使用强化学习在各种环境中针对真实编程任务进行训练,生成的代码能够高度反映人类的风格和 PR 偏好,精确遵循指令,并可以迭代运行测试,直到获得合格结果。

自今天开始,ChatGPT Pro、Team 和 Enterprise 用户即可使用 Codex,Plus 和 Edu 用户也很快可以上线使用。

对于 OpenAI 的新智能体产品,大家的反应似乎非常兴奋。有人表示自己被震撼到了,迫不及待想要体验一番。十年前学习编程时,绝对想不到这会成为可能。

也有人认为,Codex 这个云原生的智能体实际上可以自行构建、修复并交付功能,感觉就像软件开始了大规模自我编写。

还有人现身说法,在经过对 Codex 大量测试后发现,当它正常运作时,几乎更擅长「模拟」代码正在做什么以及看起来是什么样子。

接下来,我们先看一下官方示例,Codex 可以并行处理多项任务:

比如要求 Codex「找出尽可能多的 topos 和语法错误并进行修复」,它会检查代码库的可维护性和 bugs:

修复文件名中含有特殊字符的 /diff 错误:

创建并使用 DEFAULT_ALCATRAZ_TIMEOUT 常量:

Codex 工作原理

从今天开始,用户可以通过 ChatGPT 侧边栏访问 Codex,输入 prompt 并点击 "编写代码" 按钮即可执行新的编程任务。

若需针对代码库提问,可点击 "Ask"。每项任务均在独立隔离的环境中处理,该环境已预加载用户的代码库。Codex 具备读写文件的能力,并可运行包括测试框架、代码检查器和类型检查器在内的各类命令。任务完成时间通常为 1 至 30 分钟(视复杂度而定),用户可实时查看 Codex 的处理进度。

任务完成后,Codex 会将其修改提交至专属环境。通过终端日志引用和测试输出记录,Codex 为所有操作提供可验证的证据链,便于用户追溯任务执行全过程。用户还可审阅结果、要求进一步修改、创建 GitHub 拉取请求或直接将变更集成至本地环境。在产品中,用户可将 Codex 环境配置为无限接近实际开发环境。

Codex 可遵循代码库中的 AGENTS.md 文件执行操作。这类文本文件(类似 README.md)用于指导 Codex 如何浏览代码库、运行哪些测试命令,以及如何遵循项目标准规范。与人类开发者类似,当获得配置好的开发环境、可靠的测试方案和清晰的文档时,Codex 智能体能发挥最佳效能。

在编码评估和内部基准测试中,即便没有 AGENTS.md 文件或定制脚手架,codex-1 也展现出强劲性能。

构建安全可靠的智能体

在设计 Codex 时,OpenAI 优先考虑安全性和透明度,以便用户能够验证其输出。用户可以通过引用、终端日志和测试结果来检查 Codex 的工作。

与 o3 相比,codex-1 始终能够生成更清晰的 patch,以便立即进行人工审核并集成到标准工作流程中。

Codex 与 o3 对比:

OpenAI 表示,Codex 智能体完全运行于云端的安全隔离容器中。任务执行期间将禁用互联网访问,确保智能体仅能交互以下内容:通过 GitHub 仓库明确提供的代码、用户通过设置脚本配置的预安装依赖项以及该智能体无法访问任何外部网站、API 或其他服务。

Codex 定价如何?

Codex 用起来贵不贵?

OpenAI 表,从今天开始,将向全球范围内的 ChatGPT Pro、Enterprise 和 Team 用户开放 Codex。在接下来的几周内,用户可以免费畅享 Codex,探索它的各项功能。此后,他们将推出限速访问和灵活的按需付费选项,供用户购买额外使用量。

对于使用 codex-mini-latest 进行开发的用户,该模型可通过 Responses API 调用,定价为:

此外,OpenAI 表示,Codex 仍处于早期开发阶段。作为研究预览版,它目前尚不具备某些功能,例如:前端工作所需的图像输入支持,在 Codex 运行过程中实时调整智能体的能力。

此外,远程智能体的执行速度比交互式编辑慢,这可能需要一定的适应时间。不过,随着时间推移,与 Codex 智能体的协作将越来越像与同事的异步协作。

最后 OpenAI 表示,未来计划推出更具交互性和灵活性的智能体工作流。

未来,编程也许真会变的越来越简单。

参考链接:https://openai.com/index/introducing-codex/

相关内容

热门资讯

事关自动续费提醒、二次号码“一... 转自:央视新闻客户端5月17日,在工业和信息化部指导下,中国通信企业协会、中国互联网协会组织基础电信...
央视披露歼10CE空战击落多架... 【#央视披露歼10CE空战击落多架战机#,自己无一损失!】#歼10CE首次实战大放异彩#5月17日,...
内蒙古唯一!“绿泰源”农产品品... 转自:草原云记者5月17日从内蒙古自治区供销合作社获悉,中华全国供销合作总社办公厅近日发布了《全国供...
问题驱动发现,今天你“问”了吗... 人的脑神经放电会产生思维吗?飞行汽车怎么造?光是不是一种物质,不同颜色的光是不同的物质吗?……今天上...
我国提出的首个风力发电机国际标... 中国青年报客户端讯(中青报·中青网记者 魏婉)记者从市场监管局获悉,由我国提出的《风能发电系统风力发...
端午假期火车票开售 日均开行超... 记者从国铁集团获悉,铁路端午假期运输自5月30日至6月3日,为期5天,预计客流最高峰为5月31日,假...
浙江县域观察:嵊州“有戏” 更... 中新网杭州5月17日电 题:浙江县域观察:嵊州“有戏” 更“富乐”作者 项菁“全国综合实力百强县市”...
突发!一地发生6.0级地震 据中国地震台网正式测定,北京时间5月17日18时22分(当地时间5月17日5时22分)在秘鲁发生6....
打造科创高地 上海科技节透露怎... 主题为“科技让生活更美好”的2025年上海科技节今天在张江科学会堂开幕。“科学红毯秀”作为每年上海科...
一瓶水赚2分钱的今麦郎困在低价... 界面新闻记者 | 李烨界面新闻编辑 | 许悦  今麦郎和娃哈哈的话题度因为一瓶水而捆绑在了一起。  ...
刷新长度纪录!巨型国产风电叶片... 转自:中国水运网5月15日,多用途船舶“法彼勒”轮装载9支V236型号巨型国产风电叶片从通州湾新出海...
中国车企开始造船了 中国车企将... 【#中国车企开始造船了# #中国车企将运力握在自己手中#!】今年前4个月,我国汽车出口193.7万辆...
祝贺!2025全国游泳冠军赛潘... 来源:央视新闻微博 今天,2025年全国游泳冠军赛男子400米自由泳决赛,潘展乐以3分45秒34的成...
2025年“汉语桥”哈萨克斯坦... 来源:中国新闻网 中新网阿斯塔纳5月17日电 (记者 单璐)当地时间16日,由中国驻哈萨克斯坦使馆主...
一家多人接连感染,罪魁祸首竟是... 来源:央视一套 近日,陆老伯(化名)一家四口先后出现发热、畏寒等症状,同时还伴有乏力、食欲不振的情况...
解锁儿时愿望!潘展乐战胜孙杨,... 10岁的潘展乐接受采访画面。十年前,稚气未脱的潘展乐在镜头前喊出那句“比孙杨快就够了”。十年后,当二...
2025体育“科”代表|吃动平... 编者按:  保持健康体重,平时需要怎么做?  是多动,还是少吃?  2025年,贵州省体育科学研究所...
潘展乐获全国游泳冠军赛400米... 今天,2025年全国游泳冠军赛男子400米自由泳决赛,潘展乐以3分45秒34的成绩夺得冠军,费立纬获...
走进来赏美景 留下来享机遇 转自:上观新闻《人民日报海外版》(2025年05月17日 第 05 版)罗斯在讲课。本文图片均由受访...
外卖大战,成为饿了么的逆袭良机 5月15日晚间,阿里巴巴集团公布2025财年第四季度及全年业绩。这是今年外卖大战开启后首份来自阿里的...