自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

OpenAI超级应用雏形初现:Codex集成计算机操控、浏览器与图像生成功能

2026-04-17 04:59:08
收藏

OpenAI宣布增强Codex桌面应用功能

今日OpenAI宣布为其Codex桌面应用程序推出重大更新,新增计算机操作、内置浏览器、图像生成功能以及超过九十款全新插件。在Codex初版发布近一年后,该公司表示目前每周已有超过三百万开发者使用该工具。OpenAI指出,此次升级旨在让开发者能够运用Codex处理「几乎一切」开发任务。

通过计算机操作功能,Codex现已能够查看用户屏幕、自主移动光标,并在任何Mac应用程序内执行点击与输入操作。多个智能体可同步运行,且不会干扰用户当前进行的其他工作。据称该特性尤其适用于前端迭代、应用程序测试以及缺乏开放API的工作流程场景。

功能扩展与集成升级

内置浏览器允许用户直接在页面上添加注释,为智能体提供精确的操作指引。当前该功能主要面向前端与游戏开发领域,未来将逐步扩展至完整的浏览器控制能力。由gpt-image-1.5驱动的图像生成功能现已集成至同一工作流程,无需单独配置API密钥,使用成本已包含在ChatGPT账户中。

本次更新同时引入九十余款新插件,涵盖与Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、微软办公套件及Databricks Neon等平台的深度集成。这些插件通过融合多类技能、应用程序接口与MCP服务器架构,显著拓展了Codex在开发者现有工具生态中的感知与执行能力。

工作流系统优化

在工作流层面,新版应用支持多终端标签页管理、GitHub代码审查注释处理、远程开发环境的SSH连接测试功能,以及可追踪智能体计划、资源与产出的摘要面板。各类文件可直接在侧边栏开启,并为PDF文档、电子表格、演示文稿提供丰富的预览支持。

OpenAI表示此次升级致力于实现「以往仅能通过大量定制指令达到的效能水准」。新加入的主动建议模式可通过关联插件、记忆库及活跃项目的上下文,自动生成包含谷歌文档批注、Slack相关对话、Notion页面及代码库背景信息的优先级行动清单,为用户推荐工作日启动方案或未完成任务续接建议。

行业生态与发展脉络

该功能集与2026年初引起广泛关注的开源智能体框架OpenClaw存在诸多共性。该框架由奥地利开发者Peter Steinberger创建,支持在本地运行可持久化运作的智能体,并能连接通讯应用、文件系统、浏览器及终端命令。其开源版本曾在七十二小时内获得六万星标关注,被业界视为个人人工智能操作系统的雏形。

随着OpenClaw的快速发展,Steinberger于今年二月加入OpenAI并主导个人智能体研发,该项目随后转为由OpenAI资助的开源基金会运作。此前行业另一领先企业曾因其最初命名问题发出商标异议,该争议最终促使开发团队两度更名,并加速了其向OpenAI的迁移进程。需要说明的是,OpenClaw早期版本主要基于该企业的模型架构运行。

当前在封闭源代码开发工具领域,与Codex形成直接竞争关系的是Anthropic推出的Claude Code。该终端式智能编码助手能够通读完整代码库、编辑文件、运行测试并提交至GitHub。今年三月Anthropic亦为其Claude产品推出了计算机操作功能,面向macOS系统的高级订阅用户开放研究预览。

Codex通过桌面应用程序将这些能力——计算机控制、网页浏览、图像生成与代码编写——整合至统一平台,并与ChatGPT账户体系深度绑定。OpenAI将这一发展方向描述为「致力于缩小人类构想与实际构建能力之间的鸿沟」。

本次更新即日起面向使用ChatGPT登录的Codex桌面用户推送。个性化功能与计算机操作特性暂未在欧盟及英国地区开放。

展开阅读全文
更多新闻