Codex + Claude Code = 梦想代理

Prompt Engineering 油管AI课堂 2026-04-03 纯讲解
总结 OpenAI把Codex集成到Claude Code里,让开发者能直接在熟悉的环境里用Codex审代码、改代码,甚至搞多模型协作。
工具 - Claude Code (Anthropic的AI编程工具); - Codex (OpenAI的AI代码模型/插件); - ChatGPT (OpenAI,用于授权和消耗额
建议 1. 先试纯审查:如果你是Vibe Coder,可以先从“模式一”(纯代码审查)开始试用,感受Codex的审查
播客音频
Prompt E_Codex + Claude Code = 梦想代理
一句话总结

OpenAI把Codex集成到Claude Code里,让开发者能直接在熟悉的环境里用Codex审代码、改代码,甚至搞多模型协作。

核心论点展开
OpenAI这招儿,聪明在哪?
. 以前让开发者换工具特别难,现在直接把Codex塞进他们天天用的Claude Code里,用户获取成本一下就低了。
. 对开发者来说,不用折腾新工具,直接在现有流程里就能尝鲜,门槛几乎为零。
Codex插件能干啥?三大模式
. 模式一:纯代码审查
. 你写完代码,让Codex帮你看看有没有问题。
. 它是单向的,只提意见,不改你的文件。
. 注意,最好别用同一个模型又写又审,容易有偏见。
. 模式二:门控审查(带循环修复)
. 这个厉害了,是自动化的质量关卡。
. Codex审完,把问题丢给Claude Code去修,修完再给Codex审,直到问题都解决。
. 适合高风险、要求严的场景,但token(额度)烧得可能比较快。
. 模式三:当子代理用(Codex救援)
. 不光审,还能让Codex动手实现具体功能。
. Claude Code当总指挥,把难啃的骨头(比如复杂功能)派给Codex去干。
. 这样能省下Claude(Anthropic)的token,让更便宜的模型(Codex)去干活。
用的时候,心里得有点数
. 成本问题:尤其是门控审查那种来回循环的,token消耗可能会很快。
. 模型偏见:写代码和审代码最好用不同供应商的模型,避免“自己审自己”。
. 适用场景:不是所有活儿都适合。高风险改动、需要严格审计、或者想省主模型token时,用它特别香。
关键数据与案例
. 视频作者用自己的“实时语音转文字”项目做了演示,让Codex审查一次更新。
. Codex成功发现了代码中一些Claude 3.5 Sonnet反复尝试都没解决的棘手漏洞和设计问题。
. 这证明了不同模型的“第二意见”在打破思维循环、发现盲点上很有效。
提到的工具/产品/技术
. Claude Code (Anthropic的AI编程工具)
. Codex (OpenAI的AI代码模型/插件)
. ChatGPT (OpenAI,用于授权和消耗额度)
. Opus模型 (Anthropic,视频中提到比Codex运行快)
金句
. “获取新客户挺难的,尤其是对开发者。如果他们已经习惯了一个生态系统和工具,想让他们换地方可不容易。”
. “让另一家提供商的模型,来审查你的主代理在干什么,可能会特别有帮助。”
. “有时候你真就需要一个态度强硬的高级工程师来审你代码,确保你的代码库保持干净。”
对 Vibe Coder 的价值
. 多模型策略实战:展示了如何在实际工作流中混合使用不同厂商的模型(如Anthropic的Claude和OpenAI的Codex),取长补短。
. 提升代码质量与可靠性:引入了自动化的、来自“第三方”的代码审查环节,可以作为减少错误、提升代码库健康度的强力工具。
. 成本优化思路:提供了将高成本主模型(Claude)作为“指挥”,低成本模型(Codex)作为“执行者”的协作范式,有效控制token消耗。
建议
先试纯审查:如果你是Vibe Coder,可以先从“模式一”(纯代码审查)开始试用,感受Codex的审查能力,成本也相对可控。
明确高价值场景:在代码审查至关重要、或主模型陷入逻辑循环解决不了问题时,主动调用Codex介入。
关注成本仪表盘:使用“门控审查”等循环模式时,务必密切监控你的API token消耗,避免意外开销。
善用“对抗性提示”:在需要深度质疑架构或设计决策时,使用插件的对抗性审查功能,获取更严格的反馈。

OpenAI刚刚采取了一项天才之举来吸引更多开发者。他们将Codex整合进了CloudCode。现在,你可以在现有的CloudCode设置中将Codex作为插件使用,我认为这使OpenAI有能力吸引更多客户,并将Codex呈现给更多开发者。

现在,Codex面向更多开发者。现在,Codex面向更多开发者。现在,在这段视频中,我将详细解析它在这段视频中,我将详细解析它在这段视频中,我将详细解析它究竟是什么,如何设置它究竟是什么,如何设置它究竟是什么,如何设置它,如何将其用于你自己的功能,如何将其用于你自己的功能,如何将其用于你自己的功能,以及那些你可能希望避免使用它的场景。以及那些你可能希望避免使用它的场景。以及那些你可能希望避免使用它的场景。那么,让我们开始吧。好的,那么,让我们开始吧。好的,那么,让我们开始吧。好的,这是一个用于CloudCode的Codex插件。

这是CloudCode的一个Codex插件。这是CloudCode的一个Codex插件。这是OpenAI的官方产品。有一些OpenAI的官方产品。有一些OpenAI的官方产品。之前有一些插件能让你在CloudCode中使用Codex插件,但这个是直接集成在CloudCode中的,但这个是直接集成在CloudCode中的,但这个是直接来自OpenAI的。现在,呃,他们有自己的来自OpenAI的。现在,呃,他们有自己的来自OpenAI的。现在,呃,他们有自己的市场,你可以从那里下载市场,你可以从那里下载市场,你可以从那里下载并安装它。我会在稍后展示给你看并安装它。我会在稍后展示给你看并安装它。

我稍后会展示给你看。现在,这是发布帖。现在,这是发布帖。现在,这是来自创作者多米尼克的发布帖。所以,他来自多米尼克,也就是创作者。所以,他来自多米尼克,也就是创作者。所以,他说:“我正在开发一个新插件。你说:“我正在开发一个新插件。你说:“我正在开发一个新插件。你现在可以现在可以现在可以从CloudCode触发Codex。并且你将能够从CloudCode触发Codex。并且你将能够从CloudCode触发Codex。你将能够将任务委托给Codex。例如,将任务委托给Codex。例如,将任务委托给Codex。

例如,你可以让Codex审查你的CloudCode实现,这确实是一个非常有用的功能。你可以将所有这些功能与现有的ChatGPT订阅一起使用。这是建立在Codex应用服务器之上的,它是一个开放的生态系统。

现在,还有其他开放生态系统。现在,还有其他人在尝试做同样的事情,但我认为从OpenAI的角度来看真的很有趣。现在,我将在一分钟内展示如何设置,然后我会展示一些实际例子,但我认为有两点需要考虑。第一点是

首先需要考虑两点。第一点是,为不同任务使用来自不同提供商的两个不同模型总是有益的。

因此,举例来说,如果你确实要实施代码示例,如果你确实要实施代码示例,如果你确实要实施代码实现,采用一个模型,你采用一个模型,你采用一个模型,你肯定希望使用另一个模型,肯定希望使用另一个模型,肯定希望使用另一个模型,来自另一个供应商,该供应商没有来自另一个供应商,该供应商没有来自另一个供应商,该供应商没有类似的偏见用于代码审查。其次,类似的偏见用于代码审查。其次,类似的偏见用于代码审查。

其次,我认为通过这种方式,OpenAI正试图将Codex呈现给正在使用CloudCode的开发者。获取新客户是困难的,尤其是对于开发者而言,如果他们已习惯于某个生态系统和工具,那么让他们从中迁移出来将会很困难。但是,通过这种方式……

嗯,不过这样一来,CloudCode用户将直接接触Codex,他们很可能会发现它的实用性。好的,这个插件功能非常丰富,但让我先带您了解安装流程,随后再展示一些实际应用案例。

现在,既然我们是在云端安装,那么你需要启动云端服务。接着,只需使用这个命令安装插件。它将在GitHub仓库中可用。现在,我们已经安装了插件市场,接下来我们将安装Codex插件。

嗯,准备安装Codex插件。嗯,准备安装Codex插件。嗯,它已经安装在我的系统上了。它已经安装在我的系统上了。它已经安装在我的系统上了。现在,如果我运行Codex,你实际上可以看到现在,如果我运行Codex,你实际上可以看到现在,如果我运行Codex,你实际上可以看到我们可以运行Codex设置。这将让我们能够设置插件。现在,一个让我们能够设置插件。现在,一个让我们能够设置插件。

如果你尚未验证Codex安装,可能会遇到一个问题,那就是需要登录。

嗯,所以,最好的方法是嗯,所以,最好的方法是嗯,所以,最好的方法是先退出这个,先退出这个,先退出这个,然后你可以进行Codex登录,然后你可以进行Codex登录,然后你可以进行Codex登录,这会带你到嗯,网页这会带你到嗯,网页这会带你到嗯,网页界面,在那里你需要登录界面,在那里你需要登录界面,在那里你需要登录你的嗯,ChatGPT账户来授权Codex你的嗯,ChatGPT账户来授权Codex你的嗯,ChatGPT账户来授权Codex访问。访问。访问。那么,具体怎么使用呢?嗯,那么,具体怎么使用呢?嗯,那么,具体怎么使用呢?

嗯,有多种不同的选择。比如,你可以用它来进行审查,对抗性审查。此外,他们还有一个相当不错的功能,叫做Codex救援。让我逐一解释这些功能,因为它们会非常有用。稍后,我会展示给你看。

稍后,我将展示实际案例,演示如何运用这些实例。现在,最简单的应用场景是Codex代码审查,这是一个非常标准的工作流程。具体操作如下:开发者在CloudCode环境中进行功能开发,随后希望Codex对实现代码进行审查。

那么,在这种情况下,实现方式是这样的:它会收集差异,将其传递给本地运行的Codex CLI服务器。服务器将进行分析和审查,然后将报告发回给CloudCode。这是一个你应该遵循的标准流程,不应重复使用相同的步骤。

你不应该用同一个模型来编写代码和审查代码,因为它本身存在固有的偏见。这里有几个要点需要考虑。首先,这是一个单向过程,Codex只负责审查,不会对文件进行任何修改。

你可以使用这个后台标志来让进程在后台运行,我会教你如何检查它的状态。它会占用你的ChatGPT配额。现在需要注意的是,Anthropic token仅用于编写代码,而OpenAI token则用于执行代码。

T114和T147将用于评审。在评审过程中,如果两者之间存在重复的协作,你将同时使用两个订阅。现在,第二种模式,即门控评审,是最有趣的一种。

嗯,但我觉得有几件事你需要留意。现在这种情况下,会出现一个停止钩子,基本上会触发一次Codex审查。所以,当一项实施完成后,它会触发Codex审查,然后你就陷入了一个循环。

所以,Codex 然后你进入一个循环。所以,Codex 然后你进入一个循环。所以,Codex 将提供它的审查。你将提供它的审查。你将提供它的审查。你把它传给 CloudCode 来修复,把它传给 CloudCode 来修复,把它传给 CloudCode 来修复,然后你循环回来看看那些问题是否得到解决。现在,这些问题是否得到解决。现在,这些问题是否得到解决。

现在,这是一个对抗性审查设置,你不仅使用Codex进行审查,还提供反馈,并迭代检查实施情况。这可能是最有用的设置。

然而,有几件事你需要考虑。那就是成本问题。嗯,所以,基于评审重新生成代码可能会迅速变得相当昂贵。

第三种模式是将Codex用作子代理,它不仅能审查代码,还能实际进行编辑。为此,你可以使用Codex救援功能,这实际上是一种方式。OpenAI确实在戏弄Anthropic,但在这个案例中,CloudCode是重点。

但在此情境下,CloudCode将扮演协调者的角色,而您也将作为协调者,能够为Codex分配不同的功能模块,这些功能模块可由Codex具体实现。此时,系统会通过Codex CLI应用服务器来执行这些功能,并在完成后直接返回结果及其评估报告。

现在,这个模式确实很棒,这个模式确实很棒,这个模式确实很棒,特别是当你想要节省你的特别是当你想要节省你的特别是当你想要节省你的Anthropic tokens,因为Anthropic tokens,因为Anthropic tokens,因为在这个例子中,实现是由Codex完成的。在这个例子中,实现是由Codex完成的。在这个例子中,实现是由Codex完成的。好的,那么让我展示一个实际的好的,那么让我展示一个实际的好的,那么让我展示一个实际的例子,看看这在实践中会是什么样子。所以,这是一个非常例子,看看这在实践中会是什么样子。所以,这是一个非常例子,看看这在实践中会是什么样子。所以,这是一个非常

所以,我正在处理一个非常复杂的代码库。这实际上是我开发的一款应用,用于实时语音转文字转录,目前我正在对它进行一些重大更新。

这是macOS上运行速度最快的语音转文字转录系统之一,完全在设备本地运行。如果你对此感兴趣,不妨试试看。现在,我刚对代码库做了一些调整,这样我就可以指派Codex来审核这些改动了。

或者可以用Codex来审查。或者实际上有一个更好的功能,你可以说类似这样的话:"使用Codex插件来审查我们到目前为止所做的更改。"

好的,刚才进行的是实时转录。现在,只需指示它调用Codex,CloudCode便会执行该操作,我们将获得结果。这可能需要一些时间,因为与Opus相比,Codex模型运行速度相对较慢。在它运行的同时,让我……

在程序运行的同时,嗯,让我现在,趁着它在运行,嗯,让我展示一个之前的案例,在这个案例中,我让它,我让它,我让它使用Codex来审查一些实现细节,而Codex实际上能够,Codex实际上能够,Codex,

实际上,Codex能够识别出代码中的一些问题,这些问题正是T158难以解决的,因为T158尝试了多次不同的迭代来解决问题,但未能成功。这正是问题所在,因为当这些模型陷入循环时,它们很难从中脱身。

对他们来说脱身真的很难。要么只能重启对话,而这在大多数情况下并不现实。因此,拥有来自另一家提供商的另一个模型来审查你的主要代理正在做什么,可能会非常有帮助。

好的,现在我们来了解一下Codex中可用的其他标志。首先是设置项,其中最重要的是启用或禁用门控审查功能。这本质上是一个循环流程,Codex和CloudCode将在此过程中持续交互。

现在,你想来回使用它。现在,你想用它来进行初始设置。好的,接下来是初始设置。好的,接下来是初始设置。好的,接下来是回顾。我们之前简单提到过这一点。是回顾。我们之前简单提到过这一点。是回顾。我们之前简单提到过这一点。现在,你也可以指定一个特定的分支。通过分支。通过分支。

默认情况下,它会查看默认分支,也就是主分支。但如果代码库有多个不同的分支,你可以指定要处理哪个分支。这在开启拉取请求前特别有用,因为你可以利用Codex代理来帮你审查这些变更。

现在,我们来回顾一下这些变化。接下来的内容不止是简单的回顾,而是对抗性审查。这是一份糟糕的评论,它不仅挑战你的代码细节,更质疑你的设计决策。这基本上就像是一位态度强硬的高级工程师在审查你的代码。

有时,这正是你所需要的,有时这正是你所需要的,有时这正是你所需要的,以确保你的代码库,以确保你的代码库,以确保你的代码库保持纯净。现在,在这种情况下,你可以,现在,在这种情况下,你可以,现在,在这种情况下,你可以特别要求它挑战某些方面或特定功能。因此,例如,挑战缓存和重试设计。这是一个额外的提示,这是一个额外的提示。

这是一个额外的提示,将与您提供给插件的标志一同使用。当您需要对设计实现(而不仅仅是语法)获得真实的第二意见时,请使用此提示。接下来是救援功能。这基本上是利用代码作为子代理。

我们已经将Code作为子代理。我们已经讨论过这一点。这委托了一个特定功能。现在,在这种情况下,你可以指定想要使用的模型,这非常棒。此外,你可以暂停、恢复、停止它,并使用不同的标志检查状态。我们已经讨论过获取其审查。

我们已经讨论过获取审查的问题。这基本上是一种保持机制,它将阻止Claude Code编写任何代码,直到修复了Code acts将要指出的问题。

现在,你应该考虑在代码审查至关重要、每次改动都必须通过审核的高风险场景中使用它。它可以应用于自动化质量门控,但需注意这可能会迅速消耗掉你的token资源。接下来要讨论的是状态检查。

这些是不同的命令或标志,它们能让你检查状态、查看运行结果或取消指定任务。好的,现在我认为这两种不同的提供者设计确实非常实用。所以,这就是我们使用的提示。

所以,这是我们之前运行的提示,它确实发现了一些之前运行中存在的问题,并且确实发现了实现中的一些关键问题。存在一些严重的漏洞。

所以,我通常的编码方式是,我会让Claude Code来验证这些bug是否确实存在,然后我们会制定一个实施计划。

好的,这就是你需要了解的全部信息。好的,这就是你需要了解的全部信息。好的,这就是你需要了解的全部信息。关于这个来自Open AI的新插件,它让你能在Claude Code内部使用Code acts。它非常聪明。它非常聪明。它非常聪明。

我强烈推荐大家去了解一下,如果你想要使用多智能体系统,不仅模型来自多个不同的提供商,连其配套工具也来自多个不同的提供商。无论如何,希望你觉得这个视频有用。感谢观看,我们下期再见。

原视频 导出PDF