目录
tags:
– 玩客笔记
– 今日头条
– AI编程
– 横向测评
– Pi
– Claude Code
– Codex
platform: 今日头条
status: 草稿
created: 2026-05-27
title: 我用了三个月 Pi,终于可以告诉你它凭什么比 Claude Code 更省更聪明

我用了三个月 Pi,终于可以告诉你它凭什么比 Claude Code 更省更聪明
全文约 4000 字,阅读约 8 分钟
适合:正在选 AI 编程 Agent 的开发者、对终端 Agent 感兴趣的 AI 玩家
一、先聊个扎心的事

2026 年,AI 编程 Agent 多到离谱。
Claude Code、Codex CLI(现在叫 Codex)、OpenCode、Cursor、Windsurf、T3 Code、Factory…… 再加上今天要聊的 Pi,十个指头根本数不过来。
如果你是个普通开发者,看着满屏的推荐和教程,大概率是这样的状态:
“到底哪个好用?”
“每个都说自己最强,我该信谁?”
“装了好几个,结果日常还是用 ChatGPT 问问题……”
我过去三个月,每天高强度使用 AI 编程 Agent。主力换过三轮:Claude Code → Codex → Pi。
今天这篇文章,我不想吹任何一个。而是把它们放在一起,从 定位、Token 消耗、功能哲学、定制性、生态、安全性、上手门槛 七个维度,做一个硬核横评。
提前说结论:
– 如果你只想写代码 → Claude Code 或 Codex 都行,开箱即用
– 如果你想让 Agent 帮你完成日常任务——搜资料、读 PDF、写稿、配音、做视频 → Pi 才是隐藏 Boss
– 如果你的预算敏感(Token 消耗)→ Pi 可以帮你省到 Claude Code 的三分之一
下面,我们一个一个说。
二、定位差异 — 你以为它们是一类东西,其实不是

很多人把 Pi 当成 Claude Code 的竞品。这个理解只说对了一半。
先看一张表:
| Claude Code | Codex | Pi | ||
|---|---|---|---|---|
| 官方定位 | 官方 Coding Agent | ChatGPT 编程模式延伸 | 终端 Coding Harness | |
| 核心产出 | 代码文件 | 代码文件 | 完成任务(代码只是手段) | |
| 预装内容 | 代码索引、测试、运行、Git、编码规范 | ChatGPT 生态工具链 | 4 个基础工具,其余空着 | |
| 类比 | 完整 IDE | 浏览器版 IDE | 终端裸机——你自己往上搭 |
Claude Code 和 Codex 是「代码交付工具」。
它们内置了一大套东西:代码索引、测试框架、LSP 支持、Git 操作、权限弹窗、计划模式…… 启动一个项目,它能直接干活。这是它们的价值,也是它们的设计目标。
Pi 是「Agent 底座」。
它的设计者是 Mario(@badlogicgames),理念很明确:做一个极简、稳健的核心,然后把扩展交给用户。
Pi 开箱只有四个工具:读文件、写文件、改文件、跑命令。
没了。
没有 MCP、没有子 Agent、没有权限弹窗、没有计划模式、没有后台进程。
听起来很寒酸对吧?
但就是这么个”寒酸”的东西,在 OpenRouter 的 Token 消耗排行榜上排第 6。排在它前面的是 Anthropic、OpenAI 这种巨头,排在它后面的是 Claude Code。
一个”啥都不带”的工具,凭什么消耗量这么大?
答案在下一节。
三、Token 消耗 — 你以为的贵其实不在模型

这是 Pi 最容易被低估的优势。
先上数据:
| 指标 | Claude Code | Codex | Pi |
|---|---|---|---|
| 系统提示词(默认) | ~15,000 tokens | ~12,000 tokens | < 1,500 tokens |
| 同等任务总消耗 | 基准 100% | ~75% | ~30-35% |
| 差出来的 Token 去哪了 | 代码索引、LSP、Git 指令等预设 | ChatGPT 工具链预设 | 几乎没有预设 |
注意这个数字:1500 vs 15000。
差出十倍。
什么意思?
你每次跟 Claude Code 说一句话,哪怕就是打个”你好”,它的大脑中已经塞进了 1.5万个 token 的预设指令——教它怎么索引代码、怎么调用测试、怎么做 Git 操作……
这些指令本身没有错,但问题是:你不是每次都在写代码。
你有时只是问一个问题、读一个文件、整理一份笔记。
而这 1.5万个 token,一直在那里,一直在消耗。
Pi 只有不到 1500 的系统提示词。它的预设只告诉 AI 最基本的事情:你有读/写/改/跑这四个工具,文档在 node_modules 里,自己去查。
好处是三个:
第一,快。 上下文越短,模型算得越快。同一条指令,Pi 的响应速度明显更快。
第二,省。 我的体感是做同样规模的任务,Pi 的 Token 消耗是 Claude Code 的三分之一左右。如果你按 Token 付费,这笔账算得过来。
第三,聪明。 这不是玄学。模型的注意力是有限的。当你的提示词里没有 1 万字的预设指令去抢注意力,模型在同一个日常任务上确实更听话、更精准。
你可以把 Pi 想象成一张白纸,Claude Code 是一张写满了注记的稿纸。画同一个东西,白纸更自由。
四、功能哲学 — 预制菜 vs 自己搭火锅

前面说到 Pi 很省 Token,但省 Token 只是结果。更深层的原因是它的设计哲学——极简主义。
我把它总结为一句话:
Claude Code / Codex 是预制菜,Pi 是自己搭火锅。
预制菜:Claude Code / Codex
你打开包装,里面什么都有。主菜、配菜、调料,全配好了。微波炉转 3 分钟,开吃。
这是它们的优势:零门槛,快速出餐。
你不需要纠结装什么工具、配什么插件。完整的代码工作流(索引、测试、Lint、提交)已经内置好了。适合标准化的开发流程。
但代价刚才说了:你为这顿预制菜付出了 2 万 Token 的”包装费”。
自己搭火锅:Pi
底座极简:一个锅底、四个核心工具。
你想吃什么,自己往里加。
- 装一个搜索 Skill → Agent 能联网搜资料
- 装一个 PDF Skill → Agent 能读文档
- 装一个 TTS Skill → Agent 能开口说话
- 装一个 HyperFrames Skill → Agent 能做视频
每个人最后手里的 Pi,长得都不一样。
搞研究的,装搜索 + PDF + 论文检索。
做内容的,装搜索 + TTS + 生图 + 视频。
写代码的,装 Git + Lint + 测试就够。
Pi 官网上写着一句话,我觉得是最精准的表达:
“世界上有很多不同类型的 Agent,但 Pi Agent 就是你自己的 Agent。”
什么意思?
在 Pi 里,如果你想要一个自定义功能,你根本不需要去翻文档、写配置、搞测试。你直接在对话里说:
“帮我写一个叫 /yeet 的扩展,功能是自动 git add、commit 并推送。”
Pi 会自己去读 node_modules 里的扩展开发文档,写一个 TypeScript 文件。你跑一句 /reload,扩展就生效了。
全程不需要重启 Agent。
这是其他任何 Agent 都做不到的。
五、定制性 — Pi 的真正杀手锏

Pi 最让我上头的部分,是它的扩展系统。
Extension:让 Pi 自己改自己
这个功能怎么用?
- 在对话里说:”帮我把上次改过的文件列出来,做个 /diff 命令。”
- Pi 会读内置的扩展文档,写一个
pi-extensions/diff.ts文件 - 输入
/reload - 从此你的 Pi 就有了
/diff命令
每次有新想法,直接说,Pi 帮你写扩展。不需要退出终端。
这才是 Agent 该有的自我进化能力。
我目前自用的扩展包括:
- /copy-all:复制整条会话到剪贴板,方便把上下文传给新会话
- /diff:列出上一轮所有修改过的文件,回车直接打开
- /yeet:自动 git add + commit + push,一条命令发布
- /tx9:把当前项目快照传到后台 Mac Mini,让另一个 Agent 异步处理
- /update:检测 Pi 的安装方式并自动升级
Skill:给 Agent 加能力的工作手册
Extension 是对 Agent 的改造,Skill 是对 Agent 的能力扩展。
Skill 本质上是一份给 Agent 的操作手册。装一个 Skill,Agent 就多一门手艺。
举个例子:
你安装一个 “搜索 Skill”,Agent 就知道怎么调用搜索 API、怎么评估结果、怎么去重排序——不需要你写任何代码。
安装方式也很简单——在 Pi 里直接说:
“帮我装一个网页搜索的 Skill,用 Tavily。”
或者搜索 ClawHub(Pi 的社区市场),一键安装。
热重载:其他 Agent 做不了的
这是 Pi 架构上最强大的地方:完全热重载。
在其他 Agent 里,你改了配置就要重启。重启意味着要重新加载项目、重新登录、重新建立上下文。
Pi 不需要。
改完 Extension 或配置,输入 /reload,新功能立刻生效。现有的会话不会断。
六、生态对比 — 各有千秋

| 维度 | Claude Code | Codex | Pi |
|---|---|---|---|
| 默认模型 | Claude 系列 | GPT 系列 | 无默认(自己配) |
| 订阅登录 | Claude Pro/Max | ChatGPT Plus/Pro | 三者都支持 |
| API Key | Anthropic | OpenAI | 10+ 服务商 |
| MCP 支持 | ✅ 原生 | ✅ 原生 | ❌ 无(但可以让 Agent 自己加) |
| LSP | ❌ 无 | ✅ 有(但有人认为是负担) | ❌ 无 |
| 社区生态 | 官方主导 | 官方主导 | OpenClaw / ClawHub 社区 |
| 共享机制 | 无 | 无 | PI Packages(打包扩展/Skill/主题) |
关于 LSP 的一个”反常识”观点
OpenCode 有一个备受称赞的功能:LSP 支持。模型编辑代码时能收到实时的类型错误反馈。
为什么?
因为 LSP 错误会大量涌入上下文窗口。模型每次改文件,都收到几十个 lint 警告,上下文被无效信息填满。
这个思路对 AI 编程领域来说,挺反常识的——不是功能越多越好,上下文空间是有限的,要留给真正重要的信息。
模型支持:Pi 更开放
Claude Code 只能调 Claude,Codex 只能调 OpenAI。
Pi 支持的服务商列表(部分):
Anthropic、OpenAI、Google Gemini、DeepSeek、Mistral、Groq、xAI、OpenRouter、Hugging Face、Cloudflare Workers AI……
它还内置了 Codex、Claude Pro/Max、GitHub Copilot 的 OAuth 登录。
这意味着:你买的 ChatGPT Plus/Pro 订阅,可以在 Pi 里直接用。 不用额外付 API 费。
七、安全模型 — 自由 vs 风险
| Claude Code | Codex | Pi | |
|---|---|---|---|
| 沙盒机制 | 有权限弹窗 | 有权限弹窗 | 无(默认完整权限) |
| 安全等级 | 高 | 高 | 低 |
| 适用场景 | 企业/敏感项目 | 企业/敏感项目 | 个人开发者/可信环境 |
Pi 默认不沙盒化。
你打开 Pi,它就拥有你电脑的完整权限。它可以读任何文件、改任何文件、跑任何命令。
听起来很吓人是吧?
但换个角度想:你的 Agent 越自由,它越强大。
当然,这不是说沙盒没价值。如果你在公司环境、敏感项目里,Claude Code 或 Codex 的权限控制更安全。
但如果你是自己用、做个人项目,Pi 的自由度更能释放模型的能力。
而且说实话:GPT-5.5 / Claude 4 这个级别的模型,我用了三个月,没出过一次危险操作。
八、上手门槛 — Pi 需要多一点耐心

公平地说,Pi 不是最友好的。
| Claude Code | Codex | Pi | |
|---|---|---|---|
| 安装 | 一键脚本 | npm 安装 | 需要 Node.js + npm |
| 模型配置 | 自动(Anthropic 登录) | 自动(OpenAI 登录) | 需手动设 API Key 或 /login |
| 首次可用 | 5 分钟 | 5 分钟 | 15-30 分钟 |
| 学习曲线 | 低 | 低 | 中 |
Pi 的入门步骤:
# 1. 安装
npm install -g --ignore-scripts @earendil-works/pi-coding-agent
# 2. 进项目目录
cd /path/to/your/project
# 3. 启动
pi
# 4. 登录或设 API Key
/login
# 5. 让 Pi 先读项目
# 输入:总结这个项目的结构和技术栈
如果你已经有 API Key,直接启动:
export ANTHROPIC_API_KEY=sk-ant-...
pi
关键建议:
– 第一次用,不要搞复杂扩展
– 先让它读一个项目,帮你写 AGENTS.md
– 从小任务开始:改一个文件、修一个 bug
– 熟悉后再开始玩 Extension 和 Skill
九、最终选购建议

写了四千字,我帮你浓缩成一句话:
写代码选 Claude Code / Codex,做事情选 Pi。
如果你的情况符合以下任意一条,Claude Code 或 Codex 更适合你:
– 每天的工作就是写 API、修 bug、搬砖
– 想要开箱即用,不想折腾配置
– 公司环境,需要权限控制
– 第一次接触 AI 编程 Agent
如果你的情况符合以下任意一条,Pi 值得你花时间上手:
– 你想让 Agent 帮你搜资料、读文档、整理信息
– 你对 AI Agent 的扩展机制感兴趣,想自己搭工作流
– 你按 Token 付费,对 API 成本敏感
– 你已经用过 Claude Code 或 Codex,想换个思路
– 你希望 Agent 能自己进化——今天加个功能、明天加个 Skill
一个关键提示:不要三个全装轮着用。
选一个作为主力,深入用它三个月。比反复横跳、每个都浅尝辄止强得多。
我自己的路径是:Claude Code(1 个月)→ Codex(1 个月)→ Pi(3 个月,至今)。
不能说 Pi 完美。它确实有门槛,有些细节还比较糙。
但在”让 Agent 真正为我工作”这件事上,Pi 给了我其他工具没有的——它为我的工作流量身定制,而不是我去适应它预设的工作流。
十、写在最后

这篇文章的内容,大多来自我过去三个月的真实体验。
Pi 的底层驱动力 OpenClaw(开源 ClawHub 社区)目前在海外极客圈已经非常活跃。Pi 的 Extension 生态、Skill 市场和 Package 分享机制,正在让它从”一个人的工具箱”变成”一个社区的底座”。
如果你正在找一个新的 Agent 来折腾,Pi 值得一试。
你现在在用哪个 AI 编程 Agent?踩过什么坑?评论区告诉我。
如果觉得这篇文章对你有帮助,欢迎点赞收藏。后续会出 Pi 的 Skill 实战教程。