Claude Code省钱攻略说实话刚用 Claude Code 的第一个月我差点被账单劝退。今天把这 5 招分享给大家每一招都是我每天在用的亲测有效。先说说我的使用情况在讲方法之前先交代一下我的使用强度方便你对照参考每天使用时长3-5 小时工作日基本全程开着主要用途全栈项目开发、代码重构、Bug 排查、写单元测试项目规模中等复杂度单项目代码量 2-5 万行优化前月花费约 $320优化后月花费约 $90省下来的钱又能多买好几个 AI 工具的会员了香得很。第一招模型分级用别什么任务都上 Opus这是最最最重要的一招也是省钱效果最明显的。很多人包括一开始的我有个误区觉得最强的模型就是最好的全程开着 Opus 干所有事。大错特错。Claude Code 支持三个级别的模型能力和价格差了十倍都不止模型定位适合场景相对价格Haiku轻量快速简单查询、文件操作、格式调整1xSonnet均衡主力日常开发、功能实现、代码解释5xOpus最强推理复杂架构设计、疑难 Bug、深度重构25x什么概念呢就是你用 Opus 干一小时的活换成 Haiku 可能只需要二十五分之一的钱。我的切换策略我现在的习惯是默认用 Sonnet—— 这是性价比最高的选择90% 的日常开发任务它都能搞定简单操作切 Haiku—— 比如 “帮我看看这个文件有哪些函数” 把这段代码格式化一下 “生成个 README”这种无脑任务直接切硬骨头才上 Opus—— 遇到逻辑特别绕的 Bug、架构级别的重构、需要深度思考的设计问题再临时切过去切换命令也很简单输入就行/model haiku# 切到轻量模型/model sonnet# 切回主力模型/model opus# 切到最强模型一个小技巧切模型之前我会先/compact压缩一下上下文下一招会讲这样新模型加载的时候不会带着一堆历史 token 跑又能省一笔。这一招 alone就能帮你省掉 40%-50% 的费用。真的别什么任务都上 Opus太奢侈了。第二招及时压缩上下文别等它自动压缩Claude Code 的上下文窗口虽然大1M token但不是无限的。而且上下文越长每一轮对话消耗的 token 就越多 —— 因为模型每次都要把整个历史读一遍。很多人不知道Claude Code 有个自动压缩机制。当上下文快满的时候它会自动把早期的内容 “压缩” 成摘要腾出空间。但自动压缩有两个问题时机不可控—— 可能你正在实现关键逻辑的时候它突然触发压缩把一些重要细节给压缩没了被动浪费—— 在自动压缩之前你已经带着超长上下文跑了很多轮每一轮都在多花钱所以我的建议是主动压缩不要等。什么时候该压缩我总结了几个最佳时机✅完成一个阶段性任务后—— 比如写完了一个功能模块接下来要开新任务了先压缩一下✅切换模型之前—— 上一条说过的切模型前先压缩✅发现对话开始啰嗦时—— 如果 Claude 回复变得冗长、开始重复之前说过的话说明上下文已经有点臃肿了✅每天下班前—— 第二天接着用的时候从一个清爽的上下文开始体验也好很多压缩命令/compact# 压缩当前上下文释放空间如果你想彻底清空重新开始/clear# 清空所有上下文怎么判断压缩效果压缩完之后可以用/cost看一下当前会话的消耗速率。同样的任务压缩后每轮消耗应该会明显下降。我自己的体感是主动压缩之后同样的工作量token 消耗能降 20% 左右。第三招设置单次任务 Token 上限防止 “runaway 消耗”这一招是给 “安全感” 的。不知道你有没有遇到过这种情况让 Claude 帮你做一个任务结果它越做越上头越挖越深从一个小问题扯出十个关联问题等你反应过来几百个 token 已经没了。我就遇到过。有一次让它帮我 “优化一下这个函数的性能”结果它直接把整个模块都重构了还顺手写了 20 个测试用例。活干得确实漂亮但账单也漂亮。解决方法给单次任务设个预算上限。Claude Code 支持在settings.json里配置maxTokensPerTask就是单次任务最多消耗多少 token到了就停。怎么设置找到你的 Claude Code 配置文件一般在~/.claude/settings.json加上这一行{maxTokensPerTask:50000}50000 token 是什么概念呢大概够完成一个中等复杂度的功能开发。如果是简单任务可能 10000 就够了。你可以根据自己的使用习惯调整保守型设 20000-30000基本不会失控均衡型设 50000大部分任务都能完成奔放型设 100000适合大型重构但风险也高我自己设的是 50000。真遇到大任务我会分阶段下达指令而不是一次性丢给它一个超级大目标。这一招的核心不是省钱是 “防翻车”。有了这个安全阀你就不用担心一觉醒来账单爆炸了。第四招批量任务用非交互模式省 30% 起步这一招知道的人不多但效果特别好。很多人用 Claude Code 都是交互模式 —— 打开终端输入指令等它回复再输入下一条。但如果你有一批类似的任务要处理比如批量改 10 个文件的格式、批量给 20 个函数加注释、批量迁移一批代码交互模式其实很浪费。因为交互模式下每一轮对话都会带着上下文历史token 是累加的。而且你人还要在旁边等着一个任务完了再发下一个。更好的方式用非交互模式-p参数批量跑。非交互模式的优势更省 token—— 每个任务独立执行没有上下文累积更快—— 可以写个脚本批量跑不用人守着可自动化—— 能接入 CI/CD、定时任务等流程几个实用例子单次查询claude-pExplain what this project does结构化输出方便脚本解析claude-pList all API endpoints in this project--output-format json批量文件处理forfileinsrc/*.js;doclaude-pAdd JSDoc comments to all functions in$file$file${file%.js}_doc.jsdone批量代码审查claude-pReview the following code for security issues, return a JSON array of findings\--output-format jsonsrc/auth.jssecurity_report.json我现在做批量迁移、批量格式化、批量生成文档这类工作全部用非交互模式跑。同样的工作量比交互模式省 30%-40% 的 token还能后台跑着不用管。第五招善用 [CLAUDE.md](CLAUDE.md) 和 Skills减少重复描述这是 “长期投资型” 的省钱方法 —— 前期花一点时间 setup后面越用越省。[CLAUDE.md](CLAUDE.md)项目知识一次写好反复使用每个项目根目录放一个CLAUDE.md文件把项目的关键信息写进去# 项目说明 ## 技术栈 - 前端React 18 TypeScript Tailwind CSS - 后端Node.js Express PostgreSQL - 部署Docker AWS ECS ## 编码规范 - 使用函数式组件不用 class 组件 - 接口统一用 RESTful 风格 - 错误处理统一用 try-catch 自定义 Error 类 - 所有公共函数必须写 JSDoc ## 目录结构 - src/components/ - 可复用组件 - src/pages/ - 页面组件 - src/api/ - 接口封装 - src/utils/ - 工具函数 ## 常见坑点 - 注意 XSS 防护用户输入必须转义 - 数据库操作必须用参数化查询禁止字符串拼接 - 异步操作必须处理错误情况这样 Claude Code 一进项目就知道该怎么写代码不用你每次都重复交代 “我们项目用什么技术栈” 代码规范是什么 。别小看这些重复描述积少成多也是一笔不小的开销。Skills把常用操作封装成技能Claude Code 的 Skills 系统可以把你经常做的操作封装成可复用的技能。比如你经常需要生成 React 组件模板写单元测试代码格式化 类型检查部署前检查清单这些都可以写成 Skill下次直接调用不用每次都描述一遍要做什么。安装 Skill 的命令npx skillsaddskill-name甚至还有个更绝的 ——claudeception这个技能它会自动观察你的操作如果你重复做某件事 3 次以上它就会自动总结成一个专属 Skill下次直接帮你自动完成。相当于越用越聪明也越用越省钱。效果对比我到底省了多少钱说了这么多方法给大家看看我优化前后的真实对比指标优化前优化后降幅月均花费~$320~$9072%日均 token 消耗~150K~45K70%Opus 使用占比60%10%-Sonnet 使用占比30%70%-Haiku 使用占比10%20%-平均任务完成时间差不多差不多-重点是生产力几乎没有下降。因为我不是 “少用”而是 “聪明地用”—— 该用强模型的时候还是用只是不该浪费的地方不浪费了。最后省钱的核心思路总结一下这 5 招背后的核心逻辑其实就三条1. 按需付费不要过度配置就像你不会用服务器跑个静态网页就上顶配一样AI 工具也是一样的道理。简单的任务用便宜的模型复杂的任务才上最强的。2. 减少冗余每一个 token 都要有价值上下文压缩、非交互模式、[CLAUDE.md](CLAUDE.md)本质上都是在减少 “重复信息” 的消耗。同样的话说一遍就够了不要反复说。3. 建立机制而不是靠意志力设置 token 上限、写好 [CLAUDE.md](CLAUDE.md)、封装 Skills这些都是 “机制”。有了机制你不用每次都提醒自己 “省着点用”系统会自动帮你优化。附赠日常检查清单最后给大家一个我每天都会用的检查清单照着做想不省钱都难早上开工前先看看昨天的会话有没有必要保留没用就/clear每个任务前想想要不要切模型简单任务直接/model haiku每个任务后顺手/compact一下保持上下文清爽中午吃饭前/cost --total看一眼上午的消耗心里有数批量任务能用-p非交互模式就不用交互模式新项目先写好CLAUDE.md磨刀不误砍柴工好了以上就是我用 Claude Code 半年多总结出来的省钱心得。说实话AI 编程工具确实贵但它带来的效率提升也是真的。关键是要学会 “聪明地用”而不是 “省着不用”。毕竟工具是为人服务的。花最少的钱办最多的事这才是高手。如果你还有其他省钱小技巧欢迎在评论区交流觉得有用的话点个赞收藏一下下次账单爆炸的时候翻出来看看。
Claude Code省钱攻略
Claude Code省钱攻略说实话刚用 Claude Code 的第一个月我差点被账单劝退。今天把这 5 招分享给大家每一招都是我每天在用的亲测有效。先说说我的使用情况在讲方法之前先交代一下我的使用强度方便你对照参考每天使用时长3-5 小时工作日基本全程开着主要用途全栈项目开发、代码重构、Bug 排查、写单元测试项目规模中等复杂度单项目代码量 2-5 万行优化前月花费约 $320优化后月花费约 $90省下来的钱又能多买好几个 AI 工具的会员了香得很。第一招模型分级用别什么任务都上 Opus这是最最最重要的一招也是省钱效果最明显的。很多人包括一开始的我有个误区觉得最强的模型就是最好的全程开着 Opus 干所有事。大错特错。Claude Code 支持三个级别的模型能力和价格差了十倍都不止模型定位适合场景相对价格Haiku轻量快速简单查询、文件操作、格式调整1xSonnet均衡主力日常开发、功能实现、代码解释5xOpus最强推理复杂架构设计、疑难 Bug、深度重构25x什么概念呢就是你用 Opus 干一小时的活换成 Haiku 可能只需要二十五分之一的钱。我的切换策略我现在的习惯是默认用 Sonnet—— 这是性价比最高的选择90% 的日常开发任务它都能搞定简单操作切 Haiku—— 比如 “帮我看看这个文件有哪些函数” 把这段代码格式化一下 “生成个 README”这种无脑任务直接切硬骨头才上 Opus—— 遇到逻辑特别绕的 Bug、架构级别的重构、需要深度思考的设计问题再临时切过去切换命令也很简单输入就行/model haiku# 切到轻量模型/model sonnet# 切回主力模型/model opus# 切到最强模型一个小技巧切模型之前我会先/compact压缩一下上下文下一招会讲这样新模型加载的时候不会带着一堆历史 token 跑又能省一笔。这一招 alone就能帮你省掉 40%-50% 的费用。真的别什么任务都上 Opus太奢侈了。第二招及时压缩上下文别等它自动压缩Claude Code 的上下文窗口虽然大1M token但不是无限的。而且上下文越长每一轮对话消耗的 token 就越多 —— 因为模型每次都要把整个历史读一遍。很多人不知道Claude Code 有个自动压缩机制。当上下文快满的时候它会自动把早期的内容 “压缩” 成摘要腾出空间。但自动压缩有两个问题时机不可控—— 可能你正在实现关键逻辑的时候它突然触发压缩把一些重要细节给压缩没了被动浪费—— 在自动压缩之前你已经带着超长上下文跑了很多轮每一轮都在多花钱所以我的建议是主动压缩不要等。什么时候该压缩我总结了几个最佳时机✅完成一个阶段性任务后—— 比如写完了一个功能模块接下来要开新任务了先压缩一下✅切换模型之前—— 上一条说过的切模型前先压缩✅发现对话开始啰嗦时—— 如果 Claude 回复变得冗长、开始重复之前说过的话说明上下文已经有点臃肿了✅每天下班前—— 第二天接着用的时候从一个清爽的上下文开始体验也好很多压缩命令/compact# 压缩当前上下文释放空间如果你想彻底清空重新开始/clear# 清空所有上下文怎么判断压缩效果压缩完之后可以用/cost看一下当前会话的消耗速率。同样的任务压缩后每轮消耗应该会明显下降。我自己的体感是主动压缩之后同样的工作量token 消耗能降 20% 左右。第三招设置单次任务 Token 上限防止 “runaway 消耗”这一招是给 “安全感” 的。不知道你有没有遇到过这种情况让 Claude 帮你做一个任务结果它越做越上头越挖越深从一个小问题扯出十个关联问题等你反应过来几百个 token 已经没了。我就遇到过。有一次让它帮我 “优化一下这个函数的性能”结果它直接把整个模块都重构了还顺手写了 20 个测试用例。活干得确实漂亮但账单也漂亮。解决方法给单次任务设个预算上限。Claude Code 支持在settings.json里配置maxTokensPerTask就是单次任务最多消耗多少 token到了就停。怎么设置找到你的 Claude Code 配置文件一般在~/.claude/settings.json加上这一行{maxTokensPerTask:50000}50000 token 是什么概念呢大概够完成一个中等复杂度的功能开发。如果是简单任务可能 10000 就够了。你可以根据自己的使用习惯调整保守型设 20000-30000基本不会失控均衡型设 50000大部分任务都能完成奔放型设 100000适合大型重构但风险也高我自己设的是 50000。真遇到大任务我会分阶段下达指令而不是一次性丢给它一个超级大目标。这一招的核心不是省钱是 “防翻车”。有了这个安全阀你就不用担心一觉醒来账单爆炸了。第四招批量任务用非交互模式省 30% 起步这一招知道的人不多但效果特别好。很多人用 Claude Code 都是交互模式 —— 打开终端输入指令等它回复再输入下一条。但如果你有一批类似的任务要处理比如批量改 10 个文件的格式、批量给 20 个函数加注释、批量迁移一批代码交互模式其实很浪费。因为交互模式下每一轮对话都会带着上下文历史token 是累加的。而且你人还要在旁边等着一个任务完了再发下一个。更好的方式用非交互模式-p参数批量跑。非交互模式的优势更省 token—— 每个任务独立执行没有上下文累积更快—— 可以写个脚本批量跑不用人守着可自动化—— 能接入 CI/CD、定时任务等流程几个实用例子单次查询claude-pExplain what this project does结构化输出方便脚本解析claude-pList all API endpoints in this project--output-format json批量文件处理forfileinsrc/*.js;doclaude-pAdd JSDoc comments to all functions in$file$file${file%.js}_doc.jsdone批量代码审查claude-pReview the following code for security issues, return a JSON array of findings\--output-format jsonsrc/auth.jssecurity_report.json我现在做批量迁移、批量格式化、批量生成文档这类工作全部用非交互模式跑。同样的工作量比交互模式省 30%-40% 的 token还能后台跑着不用管。第五招善用 [CLAUDE.md](CLAUDE.md) 和 Skills减少重复描述这是 “长期投资型” 的省钱方法 —— 前期花一点时间 setup后面越用越省。[CLAUDE.md](CLAUDE.md)项目知识一次写好反复使用每个项目根目录放一个CLAUDE.md文件把项目的关键信息写进去# 项目说明 ## 技术栈 - 前端React 18 TypeScript Tailwind CSS - 后端Node.js Express PostgreSQL - 部署Docker AWS ECS ## 编码规范 - 使用函数式组件不用 class 组件 - 接口统一用 RESTful 风格 - 错误处理统一用 try-catch 自定义 Error 类 - 所有公共函数必须写 JSDoc ## 目录结构 - src/components/ - 可复用组件 - src/pages/ - 页面组件 - src/api/ - 接口封装 - src/utils/ - 工具函数 ## 常见坑点 - 注意 XSS 防护用户输入必须转义 - 数据库操作必须用参数化查询禁止字符串拼接 - 异步操作必须处理错误情况这样 Claude Code 一进项目就知道该怎么写代码不用你每次都重复交代 “我们项目用什么技术栈” 代码规范是什么 。别小看这些重复描述积少成多也是一笔不小的开销。Skills把常用操作封装成技能Claude Code 的 Skills 系统可以把你经常做的操作封装成可复用的技能。比如你经常需要生成 React 组件模板写单元测试代码格式化 类型检查部署前检查清单这些都可以写成 Skill下次直接调用不用每次都描述一遍要做什么。安装 Skill 的命令npx skillsaddskill-name甚至还有个更绝的 ——claudeception这个技能它会自动观察你的操作如果你重复做某件事 3 次以上它就会自动总结成一个专属 Skill下次直接帮你自动完成。相当于越用越聪明也越用越省钱。效果对比我到底省了多少钱说了这么多方法给大家看看我优化前后的真实对比指标优化前优化后降幅月均花费~$320~$9072%日均 token 消耗~150K~45K70%Opus 使用占比60%10%-Sonnet 使用占比30%70%-Haiku 使用占比10%20%-平均任务完成时间差不多差不多-重点是生产力几乎没有下降。因为我不是 “少用”而是 “聪明地用”—— 该用强模型的时候还是用只是不该浪费的地方不浪费了。最后省钱的核心思路总结一下这 5 招背后的核心逻辑其实就三条1. 按需付费不要过度配置就像你不会用服务器跑个静态网页就上顶配一样AI 工具也是一样的道理。简单的任务用便宜的模型复杂的任务才上最强的。2. 减少冗余每一个 token 都要有价值上下文压缩、非交互模式、[CLAUDE.md](CLAUDE.md)本质上都是在减少 “重复信息” 的消耗。同样的话说一遍就够了不要反复说。3. 建立机制而不是靠意志力设置 token 上限、写好 [CLAUDE.md](CLAUDE.md)、封装 Skills这些都是 “机制”。有了机制你不用每次都提醒自己 “省着点用”系统会自动帮你优化。附赠日常检查清单最后给大家一个我每天都会用的检查清单照着做想不省钱都难早上开工前先看看昨天的会话有没有必要保留没用就/clear每个任务前想想要不要切模型简单任务直接/model haiku每个任务后顺手/compact一下保持上下文清爽中午吃饭前/cost --total看一眼上午的消耗心里有数批量任务能用-p非交互模式就不用交互模式新项目先写好CLAUDE.md磨刀不误砍柴工好了以上就是我用 Claude Code 半年多总结出来的省钱心得。说实话AI 编程工具确实贵但它带来的效率提升也是真的。关键是要学会 “聪明地用”而不是 “省着不用”。毕竟工具是为人服务的。花最少的钱办最多的事这才是高手。如果你还有其他省钱小技巧欢迎在评论区交流觉得有用的话点个赞收藏一下下次账单爆炸的时候翻出来看看。