默认高阶路径:跳过已会基础,直接做场景判断。

先看路径

先看 3 小时训练怎么分段,决定今天要不要跳过基础。

先看场景

先看什么时候用 Desktop、CLI、Skills、插件、Agents。

先开原型

先进入可操作的工作台,边填主题边看结果。

PBL: Project Based Learning

用一个项目,把 Codex 的真实用法跑通

这不是从零教程。默认假设你已经能用 Codex Desktop,也会一些 CLI 操作,所以重点放在工具选择、上下文压缩、Skills、插件、Agents/Subagents 和 AI Native 工作流。

Codex PBL 学习地图

对齐你的当前水平

课程按“已会基础、补齐高阶应用”的状态设计。基础不是删除,而是折叠为可回看材料。

默认建议

先走“路径 -> 原型 -> 场景”,不要一开始同时看所有章节。你已经会的基础会自动收起,只有需要时再打开详细模式。

Desktop 基础

适合补“对话探索、需求整理、轻量问答”。你默认跳过。

可折叠10 min

CLI 入门

适合补“读文件、改文件、跑命令、看结果”。你默认跳过。

可折叠15 min

场景判断

核心训练:同一需求下该用 Desktop、CLI、Skill、Plugin 还是 Agent。

主线50 min

上下文压缩

核心训练:让多轮任务不中断、不漂移,并能顺利交接。

主线35 min

3 小时路径

顺序是先跑一个最小闭环,再扩展到工具选择和复杂任务治理。

0-15

能力校准

确认哪些基础跳过,明确本次只练“做事方式”。

15-45

收敛闭环

用一个小功能跑完:目标、计划、编辑、验证、交付。

45-85

能力决策

把 Desktop、CLI、Skills、插件、Agents 放到同一张场景表里。

85-120

上下文压缩

把长对话压成可继续执行的任务状态,不丢约束。

120-160

分工与扩展

判断哪些工作值得交给 Subagent,哪些必须主线程完成。

160-180

复盘迁移

沉淀一套你自己的 prompt、压缩模板和场景判断清单。

贯穿项目:AI Native Content Workbench

新项目,不依赖你现有本地代码。它足够小,但能覆盖内容、代码、图像、自动化、协作和部署准备。

输入

一个主题、目标读者、发布渠道、约束条件。

人给边界AI 问缺口

处理

Codex 拆任务、生成网页、检查文本、必要时调用 Skills 或 Agents。

CLI 主干Skill 增强

输出

本地可打开页面、配图建议、发布清单、可压缩上下文。

可验收可迁移
主线任务

让 Codex 帮你做一个“主题到网页”的小工具:输入主题后产出结构化页面、配图说明、发布检查项。过程中每遇到一个能力点,都用真实判断替代概念背诵。

已内置最小原型:example-workbench/index.html。它用于练习“从主题到结构化输出,再到上下文压缩”的闭环。

场景决策

重点不是记住工具名,而是判断任务形态。下面的矩阵和交互案例用于训练这种判断。

Codex 能力选择决策图

最短判断法

Desktop:想法还散、需要讨论、没有明确文件产物。

CLI:要读写本地项目、运行命令、验证结果、形成可交付文件。

Skills:任务需要稳定专门流程,如浏览器、图片、翻译、文档、发布。

插件:你需要把外部系统能力接入 Codex,形成长期可复用入口。

Agents:任务可并行拆解,且子任务结果独立、不互相抢文件。

MCP:你已经有可用的标准化资源时才接,当前环境没有可用 MCP 资源,所以这里先学判断,不学接线。

展开详细矩阵
能力适合场景
最适合高收益使用
不适合容易浪费
例子贯穿项目
验收怎么确认
风险怎么控
Desktop探索、比较、想法整理。
模糊问题先让它帮你收敛目标。
工程落地要改文件时切到 CLI。
定主题讨论页面面向谁。
输出清晰目标、约束、验收完整。
漂移用压缩模板收束。
CLI读写文件、跑测试、部署前检查。
本地项目让 Codex 直接产出文件。
纯脑暴没有产物时成本偏高。
生成网页创建 HTML/CSS/JS。
可运行浏览器打开无错误。
误改先列计划、限定路径。
Skills封装好的专门流程。
跨能力图片、浏览器、翻译、发布。
普通代码改动直接 CLI 更快。
生成配图用图片 Skill 或本地 SVG。
结果落盘资产路径可追踪。
依赖外部确认账号、API、网络。
插件外部系统长期接入。
固定业务系统如公司 API、CMS、知识库。
一次性任务不值得先造入口。
发布入口把内容推到内部平台。
权限清晰能审计、能复用。
边界不清先写人工步骤。
Agents并行研究和分工实现。
独立子任务调研、审阅、分文件实现。
强依赖链阻塞主路径时不该等。
并行审查一个查文案,一个查代码。
结果可合并输出路径和结论明确。
冲突限定写入范围。

上下文压缩

你的问题里这个点很关键。压缩不是总结聊天记录,而是把“下一轮还能继续执行”的状态保存下来。

什么时候压缩

任务超过 30 分钟、多次改方向、准备换模型/换会话、准备交给 Agent、或者你发现 Codex 开始忘约束。

长任务交接防漂移

压缩保留什么

目标、当前状态、已决策、硬约束、文件路径、未解决问题、下一步动作、验收标准。

可执行可验证可交接

压缩模板

用于换会话、交给 Agent、阶段复盘。

恢复模板

用于新会话继续做同一任务。

PBL 关卡

每关都围绕同一个项目推进,最后你得到的是一套能迁移到别的任务的工作方法。

关卡 1:最小闭环

目标:让 Codex 创建一个小页面,包含主题输入、结果区域、检查清单。重点练“目标、约束、验收”。

不要做:一上来就让它扩展成完整产品。

交付标准

本地能打开,页面不空白;按钮有明确状态;README 说明本地打开方式;不引入不必要依赖。

关卡 2:Desktop vs CLI

同一需求先用 Desktop 收敛,再用 CLI 落地文件。重点体会“讨论”和“执行”是两种工作。

判断题

如果只是比较 3 种产品定位,用 Desktop。若要把结论写入项目 README 并验证链接,用 CLI。

关卡 3:Skills

给内容工作台增加配图或浏览器检查。图片可以走图片 Skill;页面交互检查可以走 Playwright Skill。

判断题

如果只是改 CSS,不用 Skill。若要真实打开页面、截图、验证按钮状态,Playwright Skill 才有价值。

关卡 4:插件

当你的任务反复需要接入某个外部系统,例如 CMS、飞书、内部 API,就考虑插件化。

判断题

一次性导出 Markdown 不值得做插件。每周都要把内容推到固定系统,插件才有长期收益。

关卡 5:Agents/Subagents

把“文案检查”和“代码检查”并行交给两个子任务,但主线程继续做不会冲突的工作。

判断题

如果下一步必须等一个结论,主线程自己做。若子任务只是并行审阅或独立改不同文件,才适合 Agent。

关卡 6:上下文压缩与迁移

把本项目压缩成下一轮可恢复状态,然后迁移到另一个主题,例如课程页、产品页、内部 SOP 页。

判断题

压缩文本能让下一轮直接从“文件、决策、下一步”继续,而不是重新解释整段历史。

补充:Desktop 基础复习

用 Desktop 处理早期不确定性:比较方案、澄清目标、生成候选结构、解释概念。不要把需要本地验证的工程任务长期停留在 Desktop。

补充:CLI 基础复习

用 CLI 处理文件、命令和验证:先让 Codex 看目录,再限定修改范围,最后运行最小验证。关键是让结果落到文件系统,而不是停留在建议。

Prompt 卡片

这些模板不是为了写得长,而是为了让 Codex 有足够边界直接执行。

收敛项目

用于开局收敛。

让 CLI 执行

用于本地落地。

判断是否用 Skill

用于场景判断。

判断是否用 Agent

用于并行分工。

AI Native 的理解

这里的关键不是“让 AI 回答问题”,而是重新组织工作流。

人负责边界

定义目标、约束、验收、风险偏好。越靠近业务判断,越不能完全丢给 AI。

AI 负责推进

读上下文、拆任务、生成产物、运行验证、指出风险,并把结果沉淀成可复用模板。

流程负责复利

一次任务结束后,保留 prompt、压缩上下文、检查清单和决策依据,下一次更快。

1. 目标一句话说明要交付什么,不把想法堆成愿望清单。
2. 约束写清路径、技术栈、时间、不能做什么。
3. 分工主线程做关键路径,Agent 做独立并行项。
4. 验证从最小检查开始,再扩大到页面、测试或部署。
5. 沉淀把结论变成下一次可复制的模板。