Codex PBL Lab

对齐你的当前水平

课程按“已会基础、补齐高阶应用”的状态设计。基础不是删除，而是折叠为可回看材料。

默认建议

先走“路径 -> 原型 -> 场景”，不要一开始同时看所有章节。你已经会的基础会自动收起，只有需要时再打开详细模式。

Desktop 基础

适合补“对话探索、需求整理、轻量问答”。你默认跳过。

可折叠10 min

CLI 入门

适合补“读文件、改文件、跑命令、看结果”。你默认跳过。

可折叠15 min

场景判断

核心训练：同一需求下该用 Desktop、CLI、Skill、Plugin 还是 Agent。

主线50 min

上下文压缩

核心训练：让多轮任务不中断、不漂移，并能顺利交接。

主线35 min

3 小时路径

顺序是先跑一个最小闭环，再扩展到工具选择和复杂任务治理。

0-15

能力校准

确认哪些基础跳过，明确本次只练“做事方式”。

15-45

收敛闭环

用一个小功能跑完：目标、计划、编辑、验证、交付。

45-85

能力决策

把 Desktop、CLI、Skills、插件、Agents 放到同一张场景表里。

85-120

上下文压缩

把长对话压成可继续执行的任务状态，不丢约束。

120-160

分工与扩展

判断哪些工作值得交给 Subagent，哪些必须主线程完成。

160-180

复盘迁移

沉淀一套你自己的 prompt、压缩模板和场景判断清单。

贯穿项目：AI Native Content Workbench

新项目，不依赖你现有本地代码。它足够小，但能覆盖内容、代码、图像、自动化、协作和部署准备。

输入

一个主题、目标读者、发布渠道、约束条件。

人给边界AI 问缺口

处理

Codex 拆任务、生成网页、检查文本、必要时调用 Skills 或 Agents。

CLI 主干Skill 增强

输出

本地可打开页面、配图建议、发布清单、可压缩上下文。

可验收可迁移

主线任务

让 Codex 帮你做一个“主题到网页”的小工具：输入主题后产出结构化页面、配图说明、发布检查项。过程中每遇到一个能力点，都用真实判断替代概念背诵。

已内置最小原型：example-workbench/index.html。它用于练习“从主题到结构化输出，再到上下文压缩”的闭环。

场景决策

重点不是记住工具名，而是判断任务形态。下面的矩阵和交互案例用于训练这种判断。

最短判断法

Desktop：想法还散、需要讨论、没有明确文件产物。

CLI：要读写本地项目、运行命令、验证结果、形成可交付文件。

Skills：任务需要稳定专门流程，如浏览器、图片、翻译、文档、发布。

插件：你需要把外部系统能力接入 Codex，形成长期可复用入口。

Agents：任务可并行拆解，且子任务结果独立、不互相抢文件。

MCP：你已经有可用的标准化资源时才接，当前环境没有可用 MCP 资源，所以这里先学判断，不学接线。

展开详细矩阵

能力适合场景

最适合高收益使用

不适合容易浪费

例子贯穿项目

验收怎么确认

风险怎么控

Desktop探索、比较、想法整理。

模糊问题先让它帮你收敛目标。

工程落地要改文件时切到 CLI。

定主题讨论页面面向谁。

输出清晰目标、约束、验收完整。

漂移用压缩模板收束。

CLI读写文件、跑测试、部署前检查。

本地项目让 Codex 直接产出文件。

纯脑暴没有产物时成本偏高。

生成网页创建 HTML/CSS/JS。

可运行浏览器打开无错误。

误改先列计划、限定路径。

Skills封装好的专门流程。

跨能力图片、浏览器、翻译、发布。

普通代码改动直接 CLI 更快。

生成配图用图片 Skill 或本地 SVG。

结果落盘资产路径可追踪。

依赖外部确认账号、API、网络。

插件外部系统长期接入。

固定业务系统如公司 API、CMS、知识库。

一次性任务不值得先造入口。

发布入口把内容推到内部平台。

权限清晰能审计、能复用。

边界不清先写人工步骤。

Agents并行研究和分工实现。

独立子任务调研、审阅、分文件实现。

强依赖链阻塞主路径时不该等。

并行审查一个查文案，一个查代码。

结果可合并输出路径和结论明确。

冲突限定写入范围。

上下文压缩

你的问题里这个点很关键。压缩不是总结聊天记录，而是把“下一轮还能继续执行”的状态保存下来。

什么时候压缩

任务超过 30 分钟、多次改方向、准备换模型/换会话、准备交给 Agent、或者你发现 Codex 开始忘约束。

长任务交接防漂移

压缩保留什么

目标、当前状态、已决策、硬约束、文件路径、未解决问题、下一步动作、验收标准。

可执行可验证可交接

压缩模板

请把当前对话压缩成“下一轮可继续执行”的任务上下文，使用以下结构：

1. 最终目标：
2. 当前产物与文件路径：
3. 已确认的决策：
4. 不能改变的约束：
5. 已完成的步骤：
6. 未完成但重要的步骤：
7. 风险和待验证点：
8. 下一步最小动作：

要求：
- 不要复述闲聊。
- 不要省略用户后续强调过的修正。
- 如果前后需求有冲突，以最新需求为准，并说明被替换的旧假设。

用于换会话、交给 Agent、阶段复盘。

恢复模板

下面是上一次压缩后的上下文。请先检查是否有冲突或缺口，再继续执行，不要从头重做。

[粘贴压缩上下文]

这轮目标：
- 只推进“下一步最小动作”。
- 如果发现上下文缺关键文件或约束，先从本地检查，不要猜。
- 修改文件前先说明将改哪些文件和原因。
- 完成后给出文件路径、验证方式和剩余风险。

用于新会话继续做同一任务。

PBL 关卡

每关都围绕同一个项目推进，最后你得到的是一套能迁移到别的任务的工作方法。

关卡 1：最小闭环

目标：让 Codex 创建一个小页面，包含主题输入、结果区域、检查清单。重点练“目标、约束、验收”。

不要做：一上来就让它扩展成完整产品。

交付标准

本地能打开，页面不空白；按钮有明确状态；README 说明本地打开方式；不引入不必要依赖。

关卡 2：Desktop vs CLI

同一需求先用 Desktop 收敛，再用 CLI 落地文件。重点体会“讨论”和“执行”是两种工作。

判断题

如果只是比较 3 种产品定位，用 Desktop。若要把结论写入项目 README 并验证链接，用 CLI。

关卡 3：Skills

给内容工作台增加配图或浏览器检查。图片可以走图片 Skill；页面交互检查可以走 Playwright Skill。

判断题

如果只是改 CSS，不用 Skill。若要真实打开页面、截图、验证按钮状态，Playwright Skill 才有价值。

关卡 4：插件

当你的任务反复需要接入某个外部系统，例如 CMS、飞书、内部 API，就考虑插件化。

判断题

一次性导出 Markdown 不值得做插件。每周都要把内容推到固定系统，插件才有长期收益。

关卡 5：Agents/Subagents

把“文案检查”和“代码检查”并行交给两个子任务，但主线程继续做不会冲突的工作。

判断题

如果下一步必须等一个结论，主线程自己做。若子任务只是并行审阅或独立改不同文件，才适合 Agent。

关卡 6：上下文压缩与迁移

把本项目压缩成下一轮可恢复状态，然后迁移到另一个主题，例如课程页、产品页、内部 SOP 页。

判断题

压缩文本能让下一轮直接从“文件、决策、下一步”继续，而不是重新解释整段历史。

补充：Desktop 基础复习

用 Desktop 处理早期不确定性：比较方案、澄清目标、生成候选结构、解释概念。不要把需要本地验证的工程任务长期停留在 Desktop。

补充：CLI 基础复习

用 CLI 处理文件、命令和验证：先让 Codex 看目录，再限定修改范围，最后运行最小验证。关键是让结果落到文件系统，而不是停留在建议。

Prompt 卡片

这些模板不是为了写得长，而是为了让 Codex 有足够边界直接执行。

收敛项目

我想做一个本地静态小项目：[项目目标]。

请先不要实现，先帮我收敛：
1. 最小可交付版本是什么？
2. 哪些需求应该暂时排除？
3. 应该创建哪些文件？
4. 最小验收标准是什么？

我的当前水平：
- 我会用 Codex Desktop。
- 我会一些 Codex CLI 基础。
- 我更需要你解释 Skills、插件、Agents 的应用场景。

用于开局收敛。

让 CLI 执行

请在当前工作区创建一个最小本地静态应用。

约束：
- 不引入构建工具，优先 HTML/CSS/JS。
- 修改前先检查目录和已有说明文件。
- 文件写入限制在 [目标目录]。
- 完成后运行可用的最小验证。

验收：
- 浏览器直接打开可用。
- 页面包含真实交互。
- README 写清本地打开方式。
- 最后说明改了哪些文件。

用于本地落地。

判断是否用 Skill

请判断这个任务是否应该使用 Skill：

任务：[描述任务]

请输出：
1. 任务形态是什么？
2. 普通 CLI 是否足够？
3. 如果用 Skill，用哪个，为什么？
4. 使用 Skill 的风险或前置条件是什么？
5. 如果 Skill 不可用，fallback 是什么？

不要只解释概念，要结合这个任务给结论。

用于场景判断。

判断是否用 Agent

请判断这个任务是否适合拆给 Agents/Subagents：

任务：[描述任务]

请先给结论：
- 主线程现在应该做什么？
- 哪些子任务可以并行？
- 每个子任务的输入、输出、文件写入范围是什么？
- 哪些任务不该交给子代理？

如果不适合使用 Agent，请直接说明原因，并给出单线程执行方案。

用于并行分工。

AI Native 的理解

这里的关键不是“让 AI 回答问题”，而是重新组织工作流。

人负责边界

定义目标、约束、验收、风险偏好。越靠近业务判断，越不能完全丢给 AI。

AI 负责推进

读上下文、拆任务、生成产物、运行验证、指出风险，并把结果沉淀成可复用模板。

流程负责复利

一次任务结束后，保留 prompt、压缩上下文、检查清单和决策依据，下一次更快。

1. 目标一句话说明要交付什么，不把想法堆成愿望清单。

2. 约束写清路径、技术栈、时间、不能做什么。

3. 分工主线程做关键路径，Agent 做独立并行项。

4. 验证从最小检查开始，再扩大到页面、测试或部署。

5. 沉淀把结论变成下一次可复制的模板。

先看路径

先看场景

先开原型

用一个项目，把 Codex 的真实用法跑通

对齐你的当前水平

Desktop 基础

CLI 入门

场景判断

上下文压缩

3 小时路径

能力校准

收敛闭环

能力决策

上下文压缩

分工与扩展

复盘迁移

贯穿项目：AI Native Content Workbench

输入

处理

输出

场景决策

最短判断法

上下文压缩

什么时候压缩

压缩保留什么

压缩模板

恢复模板

PBL 关卡

关卡 1：最小闭环

交付标准

关卡 2：Desktop vs CLI

判断题

关卡 3：Skills

判断题

关卡 4：插件

判断题

关卡 5：Agents/Subagents

判断题

关卡 6：上下文压缩与迁移

判断题

Prompt 卡片

收敛项目

让 CLI 执行

判断是否用 Skill

判断是否用 Agent

AI Native 的理解

人负责边界

AI 负责推进

流程负责复利