Codex Guide / Tutorial

写给 Codex 小白用户的
全网最详细教程

从 0 到 1,把 Codex 真正用起来。不是概念讲解,而是一步一步带你认知、上手、熟练。

写给 Codex 小白用户的全网最详细教程:从 0 到 1,把 Codex 真正用起来

更新时间:2026-04-27

如果你最近经常刷到 Codex,但又总觉得它离自己很远,这篇文章就是写给你的。

很多小白第一次看到 Codex,脑子里都会冒出同样几个问题:

先说结论:

Codex 不只是"会写代码的 AI",而是一个能围绕任务持续推进、真正开始干活的 Agent。

这也是为什么,我会觉得:

对小白来说,Codex 的价值,甚至可能比对程序员还大。

因为它改变的不是"你写代码快一点",而是——很多原本你根本做不了的事,现在第一次有机会做成了。

和普通教程不同,这篇专门做了 4 件事:

真正写给 Codex 小白用户、能从认知到上手一口气讲清楚的长文

那就继续往下看。


一、什么是 Codex?

1.1 Codex 简介

先把最关键的一句话放前面:

Codex 是 OpenAI 对标 Claude Code 的编程 Agent 产品。

"编程 Agent"听起来像行业黑话,但你完全不用管那些术语,直接按更好懂的方式理解:

Codex 不是只会跟你聊天的 AI。它更像一个能围绕项目目录、文件、任务目标持续干活的 AI 助手。

它跟普通问答式 AI 最大的区别,不在于"它更聪明",而在于:

先看基础对比表:

特性 Codex Claude Code
开发商 OpenAI Anthropic
底层模型 GPT-5.5 / GPT-5.3-codex Claude Opus 4.6
定位 编程 Agent(趋近通用 Agent) 编程 Agent

Codex 本质上不是"聊天工具的升级版",而是"执行型 AI"的一个成熟形态。

1.2 为什么编程 Agent 如此重要?

很多人对 AI 的认知还停留在:回答问题、写几段代码、润色文案。但如果把视角拉高一点,你会发现真正的变化是:

编程 Agent 正在从"辅助工具",变成一种新的通用生产力接口。

为什么这么说?因为过去几十年,几乎所有信息化成果,最后都沉淀在:

只要一个 AI 足够擅长这些东西,它能做的事,就远远不只是"写代码"。

AI 正在通过代码,开始接管越来越多的实际工作流程。

编程 Agent 的终点,越来越接近通用 Agent。

1.3 模型对比:GPT-5.5 到底是什么定位?

Codex 和 Claude Code 都是上层应用,真正驱动它们的是底层模型:

产品 模型 特点
Codex GPT-5.5 / GPT-5.3-codex GPT-5.5 是最新旗舰模型,兼顾推理、编程 Agent、知识工作和长链路任务;GPT-5.3-codex 是历史上更偏编程特化的主打模型
Claude Code Claude Opus 4.6 通用能力和前端审美通常更强

⚠️ 不要再把 Codex 只理解成 GPT-5.3-codex。GPT-5.5 让它更接近“强推理 + 强执行”的工程 Agent。

在以下场景它会很强:

过去的 GPT-5.3-codex 更像“纯编程工人”;现在的 GPT-5.5 更像“工程负责人”:能规划、能执行、能检查,也更适合长上下文和多阶段任务。

图片

1.4 GPT-5.5 补充说明(基于 OpenAI 官方信息)

如果你只看旧版 README,很容易得到一个印象:Codex = GPT-5.3-codex

但在 2026-04-23,OpenAI 官方已经发布 GPT-5.5。官方定位可以概括成一句话:

GPT-5.5 是 OpenAI 最新旗舰模型,也是目前最强的 Agentic Coding 模型。

这次更新和 Codex 关系非常直接:

GPT-5.5 对 Codex 的意义,不只是“模型名换新”。它重点加强的是这些能力:

维度 旧认知 GPT-5.5 最新补充
Codex 主打模型认知 GPT-5.3-codex GPT-5.5 已成为最新旗舰选择
模型风格 纯编程特化 强推理 + 强执行 + 更稳的工具使用
适合场景 代码生成、重构、工程任务 复杂工程、长上下文、多阶段任务、调试与验证闭环
对小白的意义 更像专业编码工具 更像能拆任务、改文件、跑检查的工程负责人

一句话总结:

如果 GPT-5.3-codex 让 Codex 像一个很强的代码工人,那么 GPT-5.5 正在让它更像一个会规划、会执行、会复盘的工程负责人。

官方参考:

1.5 会员权限对比

会员类型 Codex 可用模型
Plus / Pro / Business / Enterprise GPT-5.5 可在 ChatGPT 和 Codex 中使用
Edu / Go 官方发布页列入 Codex 可用范围
免费用户 ⚠️ 官方 GPT-5.5 Codex 可用列表未明确包含,建议以账号内模型列表为准

⚠️ 模型权限会随地区、账号、套餐和灰度节奏变化。 这部分只写官方在 2026-04-23 发布 GPT-5.5 时明确给出的信息;实际可用模型,以 OpenAI 官方页面你账号里的实际模型列表为准。


二、如何获取 Codex

2.3 下载安装 Codex

Codex 客户端安装包,也可以理解成 Codex Desktop App。官方动作路径很简单:

  1. 进入 OpenAI 的 Codex 官网:https://chatgpt.com/codex
  2. 点击大大的 "下载应用" 按钮

图片

Mac 用户

Mac 用户最简单,直接打开:App Store,搜索:Codex,下载安装即可。

官方 macOS 下载链接:

下载 Mac 安装包后,安装、登录即可。

图片

Windows 用户

Windows 用户可以通过微软商店下载安装。

也可以直接在微软商店搜索 "Codex" 进行下载安装。

系统要求:

下载本身一点都不复杂。真正复杂的,从来不是"下载应用",而是后面你如何理解它、配置它、组织你的任务。

💡 现实提醒:客户端下载地址、商店上架状态和系统要求都有时效性,后续请以官方页面实际展示为准。

2.4 第一次使用:从打开 App 到完成一个小任务

下载安装只是第一步。真正建议小白练的,是先跑通一个很小、很具体、能马上验证的任务。

推荐按这个顺序来:

步骤 动作 目的
1 打开 Codex App 并登录 确认账号和模型可用
2 添加一个项目文件夹 让 Codex 能看到要处理的文件
3 新建一条 Thread 把本次任务单独装起来,避免上下文混乱
4 用一句话描述目标 例如:把 README 的下载方式同步到首页
5 先让它列计划 确认会改哪些文件、怎么改
6 执行后检查结果 看 diff、预览页面、必要时再微调

最适合新手的练习任务,不是“一上来做个大系统”,而是:

核心原则:第一次不要追求大而全,先追求可验证。 你能看懂它改了什么、能确认结果对不对,就已经跑通了最重要的一步。


三、核心概念解析

前面解决的是"怎么进门",这一段解决的是:

你进门以后,怎么不迷路。

大部分小白用 Codex 不顺,不是因为不会操作,而是因为没建立对它工作结构的理解。

3.1 Threads(线程)系统

下载好、登录到 Codex 首页后,大概会看到类似这样的界面:

图片

这里最核心的概念之一,就是 Threads(线程)

这个词听起来有点技术,但你先不用怕。你就把它理解成:

一条围绕某个具体目标持续推进的任务线。

3.2 两层结构详解

Codex 左边这栏,其实是两层结构。

层级 名称 作用 类比
第一层 文件夹(工作区) 项目目录 / 主题盒子 像一个项目群
第二层 Thread 独立的对话任务线 像群里的具体话题贴

文件夹装项目,Thread 装任务。

3.3 为什么这样设计?

它把最容易搅混的两件事,硬生生拆开了。

传统方式的痛点 Codex 的解决方案
上午写网页、下午算 Excel、晚上改文案,所有内容搅在一起 不同任务放进不同 Thread
上下文污染严重 对话和目标互不污染
AI 开始胡编乱造 可以断点续写,重新收束任务
找不到文件在哪 文件和资源分层更清晰

这张表讲的根本不是产品设计,而是:

为什么很多人第一次用 Codex,会突然觉得"终于没那么乱了"。

3.4 黄金法则

🎯 同一个文件夹里做同一个大方向,同一个 Thread 里只推进一件具体的事。

对小白来说,这一句的重要性,甚至经常高于"怎么写 prompt"。因为你一旦把任务组织好,AI 才更容易稳定。


四、项目文件夹管理

你后面越用越乱,大概率不是因为 Codex 不行,而是因为你的项目组织方式从一开始就乱。

4.1 推荐的文件夹结构

正式开始前,最好先把分类想清楚。 一个推荐的目录结构示例:

dev/
├── Learning/      # 学习资料
├── notes/         # 文章和笔记
├── Projects/      # 真实开发项目任务
├── sandbox/       # 沙盒(乱七八糟的东西)
└── tools/         # 通用脚本、可复用组件、小工具

图片

这个结构好在哪?天然就把不同用途拆开了:

4.2 Projects 示例

项目 说明
AI 热点 热点追踪项目
飞书机器人 多个不同功能的飞书机器人

图片

比如这里提到的一个具体案例:

把公众号数据定时爬下来,再存到多维表格里的飞书机器人。

图片

这说明了一件事:

Codex 并不只适合"纯代码项目",它也适合很多真实业务型任务。

4.3 添加项目文件夹

本地建好文件夹之后,可以从入口把项目目录加进 Codex:

图片

比如你想开发一个 AI 热点网站,就可以把对应文件夹加进去,再在里面开一条 Thread:

图片

⚠️ 前期分类非常重要。真的不要什么任务都随手乱开,更不要把完全不同的事情全塞进同一个地方。 你前面懒一次,后面会乱很多次。


五、功能与配置项

这一部分会让很多小白第一次意识到:

原来 Codex 不是"一个会写代码的框",而是一整套图形化工作流。

5.1 功能一:定时任务

图片

Codex 可以在特定日期去干特定的事。

代入真实场景就知道它为什么厉害了:

场景 说明
服务器托管 多个项目跑在云服务器上,但作者本人并不懂服务器
自动化巡检 Codex 每天早上 9 点自动巡检服务器,检查报错
自动修复 如果有报错,会自己解决并总结原因
通知推送 再通过飞书机器人发给作者

图片

这一套组合起来,体现的是:

你不是在"偶尔问一下 AI",而是在把 AI 接进你的日常工作流程。

5.2 功能二:Skills(技能)

图片

如果说定时任务让 Codex 更像一个"自动执行者",那么 Skills 则让它更像一个"可扩展能力平台"。

这是第一次,Skills 真正拥有了自己的可视化、图形化管理界面。

传统命令行风格的 Skill 体验,最大的问题就是:

对比项 Codex Claude Code / OpenCode
Skills 管理 图形化界面,轻松管理 不知道装了哪些、装到哪、有什么用
Skills 创建 内置 Skill Creator 需要自己找、自己安装

5.3 Skill Creator 使用

Codex 自带 Skill Creator——以前你得先知道怎么装、怎么找、怎么配;现在你可以先说"我要什么",再让系统帮你往下走。

步骤 1:点击右上角的 "New Skill"

图片

步骤 2:直接告诉它,你想做什么 Skill

图片

对小白最大的价值不是"省一点操作",而是:

你终于可以从功能需求出发,而不是先被安装和配置门槛拦住。

5.4 进阶能力:MCP、记忆系统、云端运行和电脑自动化

视频里还提到几类更进阶的能力,建议小白先建立概念,不必一开始全都配置。

能力 简单理解 适合什么时候用
MCP 给 Codex 接更多外部工具和数据源 需要连浏览器、数据库、GitHub、文件系统等工具时
记忆系统 让 Codex 记住你的长期偏好和项目规则 固定协作风格、固定输出格式、固定代码规范时
云端运行 把任务放到云端环境里跑 本地电脑不方便长时间运行,或希望异步推进任务时
电脑自动化 让 Codex 操作浏览器或桌面应用 需要填表、点页面、检查网页效果、处理重复操作时

这几项能力可以让 Codex 从“改代码工具”继续升级成“工作流助手”。但新手要注意顺序:

先学会文件夹 + Thread + Plan Mode
再学会设置规则和看 diff
最后再接 MCP、云端运行和电脑自动化

⚠️ 不要为了高级而高级。 MCP、云端和自动化都涉及权限、账号和数据访问,接入前一定要想清楚它能看到什么、能改什么、会不会碰到敏感信息。


六、设置配置

你后面用起来顺不顺,很多时候就取决于前面这几项配没配对。

6.1 General 设置

先改这两项:

配置项 推荐设置 说明
保持电脑开机 打开 允许后台运行
Follow-up behavior steer 开发过程中可随时发消息调整任务

图片

简单理解:

6.2 Personalization(个性化设置)

Personalization,本质上就是图形界面的 AGENT.md / AGENTS.md

图片

这里不是"随便写点喜好"的地方,而是你告诉 Codex:

6.3 推荐的全局规则

README 里给了一套很适合新手抄走就能用的规则模板,压缩成最好记的版本就 7 条:

提前把你的协作原则写进去,让 Codex 从第一轮开始就按你的规则工作。

6.4 权限设置

在对话首页,把权限改成 Full access

图片

💡 好处:让 Codex 对你的电脑有更高访问权限,不用每次都来回征求确认,任务推进效率会高很多。

没有绝对对错,主要看你的环境和风险偏好。


七、对话功能详解

到了这里,真正开始进入"怎么用"的层面。

7.1 斜杠命令

在对话框里输入 /,就能调起特殊功能:

图片

Codex 不是单纯聊天,它有明确的任务模式和系统操作入口。

7.2 重要功能:Plan Mode(规划模式)

如果这篇文章你只记住一个功能,那就是:

Plan Mode。

你最容易卡住的不是"不会写",而是:

Plan Mode 干的事,就是先帮你把这些理顺。

功能 说明
作用 只规划,不写代码
图标 会出现一个小图标
适用场景 每个大型项目(从 0 到 1)的起始阶段

图片

推荐工作流:

大型项目 → 先用 Plan 模式规划 → 形成规范文档和实现计划 → 再开始开发

实际案例:构建一个管理 AI 热点网站信源的 Skill。

图片

过一段时间后,你就能拿到这样一份计划:

图片

确认没问题后,选择 "是" 即可。然后 Plan 图标消失,正式进入开发:

图片

Plan Mode 对小白最大的价值,不是它多了个按钮,而是它帮你把"乱做"变成"先想清楚再做"。

7.3 重要功能:Status(状态查看)

输入 /status,就能看到:

图片

越用越多,就越需要知道 自己当前到底在什么状态、还剩多少资源

7.4 模型推理深度

图片

等级 说明 推荐场景
Low 最快最省 简单任务
Medium 平衡 一般任务
High 日常推荐 日常开发
Extra High 最稳最全 难活、硬活、大活

不想记太多,直接记这句就够了:

平时用 High,难活用 Extra High。


八、开始 Vibe Coding

讲到这里,很多人会突然发现:

原来最难的不是操作,而是前面那些认知。

一旦前面的结构你理解了,真正开始开发反而简单。

8.1 开发方式

Coding 这块反而没啥好说的了,直接用嘴描述你的需求就行。

Codex 右下角有 麦克风,支持直接语音输入:

图片

这背后真正体现的不是"语音很酷",而是:

你和 AI 的协作门槛,已经从"会不会写代码"越来越变成"会不会描述需求"。

8.2 我的开发习惯

非常建议直接照着练:

步骤 操作
1 先打开 Plan 模式
2 用自然语言描述需求(前端强调设计 Skill,服务器问题用对应 Skill)
3 计划生成后再开始开发
4 开发完第一时间看前端效果
5 效果可行就继续微调;效果不好就重做前端

最值钱的不是某个具体按钮,而是这个顺序本身:

先规划,再开发;先看结果,再决定下一步。

8.3 前端问题的解决方案

README 也很坦诚,没有故意把 Codex 神化:

⚠️ Codex 的前端能力有时候确实一般。

图片

很多小白最容易陷入的误区:

既然用了 AI,就应该什么都一次做到最好。

不是这样的。工具也有分工。README 给出的解决思路:

方案 适用条件
Claude Code + Claude Opus 4.6 有 Claude Opus 4.6(推荐)
Claude Code + K2.5 + Frontend Design Skill 没有 Claude Opus 4.6

前端效果不好,就换更适合前端的组合,不要跟工具硬较劲。

8.4 小技巧:并行开发

在 Codex 里,多个 Thread 是可以并行推进的

图片

意味着你可以从"一次只做一件事",升级到"不同目标拆成不同 Thread,同时推进"。这其实就是 AI 协作能力真正开始变强的标志。

8.5 代码管理:让 Codex 改代码,但不要把项目弄乱

Codex 越能干,越要养成基本的代码管理习惯。尤其是小白,不要只看“它帮我改完了”,还要看“它到底改了什么”。

建议每次任务都按这套检查:

检查项 建议动作
改动范围 先看它准备改哪些文件,不要让小任务变成大重构
代码差异 git diff 或界面里的 diff 看每个改动
运行检查 能跑测试就跑测试,静态网页至少本地预览一下
提交节奏 一个明确目标提交一次,不要把很多无关修改混在一起
回退意识 不确定的改动先别提交,确认结果没问题再 commit

可以直接这样要求 Codex:

先不要动代码,先告诉我要改哪些文件、每个文件为什么要改。
改完后请给我总结 diff,并告诉我应该运行哪个最小检查命令。

对新手来说,Git 不一定一开始就要很精通,但至少要记住三件事:

  1. 改之前知道目标
  2. 改之后看 diff
  3. 确认没问题再提交

会让 Codex 写代码只是第一层,会让 Codex 在可控范围内写代码,才是真正能长期用起来的关键。


九、总结

Vibe Coding 这个东西,对非程序员来说,可能比对程序员更有价值。

对程序员来说,它更多是:提效、加速、减少重复劳动。但对非程序员来说,它更像是:

把一道原本根本跨不过去的门槛,第一次给你铲平了。

人群 AI 的价值
程序员 提效工具
非程序员 直接把一道原本过不去的坎给铲平了

在未来,会用 AI 写代码,会变成像会用 Excel 一样的基本技能。

这不是鸡汤,这是趋势。而且已经在发生了。


快速参考卡

Codex vs Claude Code 快速对比

对比项 Codex Claude Code
开发商 OpenAI Anthropic
核心模型 GPT-5.5(最新旗舰)/ GPT-5.3-codex(历史主打) Claude Opus 4.6
界面 图形化 命令行
Skills 管理 图形化界面 命令行为主
定时任务 支持 需要自己配置
前端能力 ⚠️ 有时一般 通常更强

推荐设置速查

设置项 推荐值
Follow-up behavior steer
权限 Full access
推理深度(日常) Medium
推理深度(大活) High / Extra High

常用斜杠命令

命令 功能
/plan 进入规划模式
/status 查看用量和剩余额度

最后给小白一句最实用的话

如果你今天刚接触 Codex,我最建议的起步方式不是"上来就做一个大项目",而是先做一件很小、很具体、很容易验证的事,比如:

小白用 Codex,真正最重要的不是先学会所有技术细节,而是先建立 3 个能力:

  1. 会描述目标
  2. 会拆分任务
  3. 会检查结果

只要这 3 件事你开始做顺了,后面你会越来越快地进入状态。而一旦你真的开始顺起来,你就会发现:

你不是在"学一个 AI 工具",你是在学一种新的做事方式。