OpenAI升级Codex：新增Mac桌面控制、多智能体并发及持久任务处理能力

1,682 0

OpenAI 升级 Codex：AI 编程助手迈向通用自动化新阶段

近日，OpenAI 宣布对其编程智能模型 **Codex** 进行重要升级，新增了 **Mac 桌面控制**、**多智能体并发** 及 **持久任务处理** 三大核心能力。这一系列升级标志着 Codex 正从“代码生成与解释工具”向“具备环境交互与任务调度能力的智能体系统”演进，为 AI 在自动化与生产力领域的应用开辟了新路径。

核心升级解析

**1. Mac 桌面控制能力**
Codex 现已能通过自然语言指令直接操作 macOS 桌面应用，例如：“打开邮件客户端，搜索来自客户 A 的未读邮件，将附件保存到下载文件夹”。这一功能基于视觉语言模型（VLM）与系统 API 的结合实现，使 AI 能够“看见”屏幕元素并执行点击、拖拽、输入等操作。它并非简单的宏录制，而是具备上下文理解的动态交互，大幅降低了自动化脚本的编写门槛。

**2. 多智能体并发架构**
新版 Codex 支持同时调度多个专用智能体协作完成任务。例如，在开发场景中，一个智能体负责编写前端代码，另一个同步处理后端逻辑，第三个则进行实时测试验证。这种架构模仿了人类团队的分工模式，通过智能体间的通信协议（如共享状态、任务队列）确保协作效率，尤其适用于复杂项目开发与跨流程自动化。

**3. 持久任务处理机制**
Codex 现可长时间运行并保持任务状态记忆，处理可能中断或需持续数小时的任务（如数据监控、分批处理等）。其关键在于引入了“记忆上下文”管理，能保存中间结果并在恢复时快速定位进度，同时通过资源使用优化降低长期运行的能耗与成本。

技术影响与行业展望

此次升级实质上是 **“大语言模型（LLM） + 具体行动能力（Acting）”** 模式的深化。Codex 不再局限于生成文本或代码建议，而是成为能感知环境、制定计划并执行操作的“智能执行层”。这对于企业自动化（RPA+AI）、个性化助手开发及复杂工作流管理具有显著价值。

然而，挑战同样存在：**安全性**（系统权限授予边界）、**可靠性**（长时任务的错误恢复）及**伦理风险**（自动化带来的职责界定）仍需深入探索。OpenAI 在发布中强调，当前功能仍处于有限测试阶段，并嵌入了多层人工确认与操作回滚机制。

可以预见，随着 Codex 这类“具身智能”系统的发展，人机协作的形态将从“人类主导、AI 辅助”逐渐转向“AI 代理执行、人类监督优化”的新范式。开发者与企业应关注其 API 生态的演进，提前探索在软件开发、数据分析及日常办公中的集成场景，以抢占下一代智能化工具的应用先机。

> **总结而言**：OpenAI 通过赋予 Codex 环境交互、多线程协作与持久化能力，正推动 AI 从“对话与生成”迈向“规划与执行”，这不仅是技术功能的叠加，更是其向通用人工智能（AGI）目标迈进的关键一步。

AI资讯

OpenAI升级Codex：新增Mac桌面控制、多智能体并发及持久任务处理能力

GPT-Rosalind：OpenAI首推生命科学大模型加速药物研发

Anthropic产品负责人退出Figma董事席，新一代Opus 4.7或将进军设计领域

相关文章

三星首款智能眼镜亮相，外观与Meta Ray-Ban相似

AI设计护肤品成真？MetaNovas融资双轮，Agentic AI领航新材料探索

电气装备领域迎来变革，“电擎”大模型正式发布

情人节重磅!豆包2.0携火山引擎发布:视频生成迈入“工业级”时代

最新资讯