我以前看 AI 编程工具第一反应也是看它写代码快不快。能不能补全一个函数能不能生成一个组件能不能根据报错猜出原因能不能把 README 写得像样一点这些当然有用但最近几个月再看会发现 AI 编程工具的竞争已经不在“谁更会补代码”这一层了。它们开始卷一个更实际的东西上下文。这件事对程序员很重要因为真实开发里最麻烦的往往不是写一段代码而是理解这段代码为什么要这么写。你接到一个需求表面上只是改一个按钮。结果一查牵涉权限、接口、埋点、国际化、移动端适配。你以为只是修一个 bug。结果发现前端、后端、组件库、配置文件、测试用例都可能受影响。你让 AI 看一段代码它回答得挺像回事但你心里知道它没看到项目其他地方的写法所以很多建议只能当参考。这就是为什么最近这些 AI 编程工具都在往“上下文理解”靠。OpenAI 在 5 月 21 日的 ChatGPT Release Notes 里提到Codex 更新了 richer context、Goal Mode、浏览器改进和 remote locked usemacOS 上的 Appshots 可以把当前应用窗口附加到 Codex 线程里让 Codex 更理解你正在看的工作内容。Cursor 最近也在强化这个方向。它的 changelog 里写得很直白现在可以把多个 repo 附加到 automation让 agents 在多个代码库上下文中推理、交付、测试和验证任务。Kiro 的更新更像是从需求侧下手。5 月 21 日的 IDE changelog 提到 Parallel Task Execution、Quick Plan 和 Requirements Analysis重点是让 Kiro Specs 更快开始、更快完成并在实现前发现需求里的逻辑不一致。Google 新的 Gemini 3.5 Flash 也把重点放在 agents 和 coding官方说它适合复杂、长周期、能产生实际效用的任务。你看这几条消息放在一起其实都在说同一件事AI 编程正在从“写代码片段”走向“理解开发任务”。以前我们用 AI常见的问法是帮我写一个登录功能。它会写。但你复制进去以后真正的问题就来了。Token 存哪接口字段是什么错误状态怎么处理是否有验证码权限跳转规则是什么有没有统一请求封装要不要兼容已有埋点团队代码风格是不是这样这些你没告诉它它只能猜。AI 最怕的不是不会写而是猜得太多。所以现在我更建议程序员换一种用法不要急着让 AI 写代码先让它帮你拆上下文。比如同样是登录功能我会更愿意这样问我正在做一个后台系统的登录模块。 技术栈 React TypeScript Ant Design 请先不要写代码先帮我分析这个功能需要确认哪些上下文 - 前端状态 - 后端接口 - Token 存储 - 权限跳转 - 错误提示 - 表单校验 - 测试点 - 可能影响的其他模块 最后给我一个最小实现路径。这种问法看起来慢一点其实更省时间。因为它把 AI 从“代码生成器”变成了“需求审查员”。真实项目里很多返工不是因为代码写不出来而是因为一开始没把边界问清楚。我举一个更实际的场景。产品说“用户列表加一个批量禁用。”如果直接让 AI 写大概率会生成一个批量选择表格、一个按钮、一个接口调用。看起来挺完整。但真实项目里你至少要确认这些问题批量禁用有没有权限限制接口是同步还是异步部分失败怎么展示禁用后列表是否立即刷新操作记录是否要写日志被禁用用户是否包含当前登录用户二次确认文案怎么写按钮在什么状态下不可点失败记录要不要导出你看这才是开发。不是写一个按钮而是把这个按钮放进业务系统里。AI 如果只会写代码帮到的有限。AI 如果能在写代码前帮你把这些问题列出来它才真的开始有价值。可以准备一个很小的上下文模板给 AI 之前先填一下。{ project: { type: Admin System, stack: [React, TypeScript, Ant Design], module: User Management }, task: { name: Batch Disable Users, description: Add batch disable action to user list }, known_context: { has_permission_system: true, has_audit_log: true, api_supports_batch_action: unknown, need_partial_failure_handling: true }, expected_output: [ questions to confirm, risk points, minimal implementation plan, core code after confirmation, review checklist ], constraints: [ do not over-engineer, keep existing request wrapper, avoid introducing new state management library ] }这个 JSON 没什么高深的。它只是提醒你别把模糊需求直接扔给 AI。你给 AI 的上下文越像真实任务单它越不容易写出“看起来能跑但很难进项目”的代码。现在这些工具的分工也越来越清楚。ChatGPT Plus 更适合综合开发辅助比如拆问题、写脚本、解释报错、整理 README。Claude Pro 更适合长代码、长文档、复杂逻辑分析。Gemini Advanced 的优势更偏 Google 生态和资料流现在 Gemini 3.5 Flash 又明显往 agents 和 coding 方向靠。Grok 更适合实时信息、技术趋势和外部讨论观察。Cursor 更贴近编辑器和工程上下文尤其是多仓库任务。Kiro 更像是把需求、规格和任务执行串起来适合在写代码前先把开发路径理清。但程序员不要被工具名字带着跑。你真正要看的不是哪个工具最火而是你每天最容易在哪里浪费时间。如果你浪费在“代码太长看不懂”就找长上下文能力强的。如果你浪费在“需求没拆清楚”就找能做规格和任务分析的。如果你浪费在“多个仓库来回切”就关注多仓库上下文。如果你浪费在“写完才发现边界漏了”就让 AI 先做 Review checklist。工具越多越要回到自己的流程。还有一个现实问题国内开发者开这些 AI 会员经常不是卡在怎么用而是卡在怎么订阅。海外信用卡失败、虚拟卡扣款不稳定、App Store 换区、账单地址、不同平台的订阅入口这些东西看起来不是技术问题但真的会消耗时间。如果你已经确定要长期用 ChatGPT Plus、Claude Pro、Grok、Gemini Advanced、Kiro、Cursor 这类工具又不想把精力耗在支付失败和订阅流程上可以了解 gpt68.com。它是 AI会员充值平台官网显示支持 ChatGPT Plus、Claude Pro、Gemini、Super Grok、Cursor、Kiro 等主流 AI 工具会员充值并且页面明确说明自己是第三方 AI 会员充值服务平台不是 OpenAI、Anthropic、Google、xAI、Cursor、Kiro 官方网站或授权合作方。这类平台解决的是充值入口和流程问题不是替代工具本身。工具怎么用还是要回到你的开发流程里。最后说一个我自己的判断。未来 AI 编程工具真正拉开差距的不会只是“谁补全更快”。而是谁更懂项目上下文。谁更能拆需求。谁更能发现边界问题。谁能减少开发者在代码、文档、终端、仓库、需求之间反复切换。谁能让程序员少返工。程序员用 AI不该只问“它会不会写代码”更该问“它能不能让我少踩一次坑”这才是 AI 编程工具越来越强之后真正值得关注的地方。
AI 编程工具都在卷上下文,程序员真正该关心的不是谁会补全代码
我以前看 AI 编程工具第一反应也是看它写代码快不快。能不能补全一个函数能不能生成一个组件能不能根据报错猜出原因能不能把 README 写得像样一点这些当然有用但最近几个月再看会发现 AI 编程工具的竞争已经不在“谁更会补代码”这一层了。它们开始卷一个更实际的东西上下文。这件事对程序员很重要因为真实开发里最麻烦的往往不是写一段代码而是理解这段代码为什么要这么写。你接到一个需求表面上只是改一个按钮。结果一查牵涉权限、接口、埋点、国际化、移动端适配。你以为只是修一个 bug。结果发现前端、后端、组件库、配置文件、测试用例都可能受影响。你让 AI 看一段代码它回答得挺像回事但你心里知道它没看到项目其他地方的写法所以很多建议只能当参考。这就是为什么最近这些 AI 编程工具都在往“上下文理解”靠。OpenAI 在 5 月 21 日的 ChatGPT Release Notes 里提到Codex 更新了 richer context、Goal Mode、浏览器改进和 remote locked usemacOS 上的 Appshots 可以把当前应用窗口附加到 Codex 线程里让 Codex 更理解你正在看的工作内容。Cursor 最近也在强化这个方向。它的 changelog 里写得很直白现在可以把多个 repo 附加到 automation让 agents 在多个代码库上下文中推理、交付、测试和验证任务。Kiro 的更新更像是从需求侧下手。5 月 21 日的 IDE changelog 提到 Parallel Task Execution、Quick Plan 和 Requirements Analysis重点是让 Kiro Specs 更快开始、更快完成并在实现前发现需求里的逻辑不一致。Google 新的 Gemini 3.5 Flash 也把重点放在 agents 和 coding官方说它适合复杂、长周期、能产生实际效用的任务。你看这几条消息放在一起其实都在说同一件事AI 编程正在从“写代码片段”走向“理解开发任务”。以前我们用 AI常见的问法是帮我写一个登录功能。它会写。但你复制进去以后真正的问题就来了。Token 存哪接口字段是什么错误状态怎么处理是否有验证码权限跳转规则是什么有没有统一请求封装要不要兼容已有埋点团队代码风格是不是这样这些你没告诉它它只能猜。AI 最怕的不是不会写而是猜得太多。所以现在我更建议程序员换一种用法不要急着让 AI 写代码先让它帮你拆上下文。比如同样是登录功能我会更愿意这样问我正在做一个后台系统的登录模块。 技术栈 React TypeScript Ant Design 请先不要写代码先帮我分析这个功能需要确认哪些上下文 - 前端状态 - 后端接口 - Token 存储 - 权限跳转 - 错误提示 - 表单校验 - 测试点 - 可能影响的其他模块 最后给我一个最小实现路径。这种问法看起来慢一点其实更省时间。因为它把 AI 从“代码生成器”变成了“需求审查员”。真实项目里很多返工不是因为代码写不出来而是因为一开始没把边界问清楚。我举一个更实际的场景。产品说“用户列表加一个批量禁用。”如果直接让 AI 写大概率会生成一个批量选择表格、一个按钮、一个接口调用。看起来挺完整。但真实项目里你至少要确认这些问题批量禁用有没有权限限制接口是同步还是异步部分失败怎么展示禁用后列表是否立即刷新操作记录是否要写日志被禁用用户是否包含当前登录用户二次确认文案怎么写按钮在什么状态下不可点失败记录要不要导出你看这才是开发。不是写一个按钮而是把这个按钮放进业务系统里。AI 如果只会写代码帮到的有限。AI 如果能在写代码前帮你把这些问题列出来它才真的开始有价值。可以准备一个很小的上下文模板给 AI 之前先填一下。{ project: { type: Admin System, stack: [React, TypeScript, Ant Design], module: User Management }, task: { name: Batch Disable Users, description: Add batch disable action to user list }, known_context: { has_permission_system: true, has_audit_log: true, api_supports_batch_action: unknown, need_partial_failure_handling: true }, expected_output: [ questions to confirm, risk points, minimal implementation plan, core code after confirmation, review checklist ], constraints: [ do not over-engineer, keep existing request wrapper, avoid introducing new state management library ] }这个 JSON 没什么高深的。它只是提醒你别把模糊需求直接扔给 AI。你给 AI 的上下文越像真实任务单它越不容易写出“看起来能跑但很难进项目”的代码。现在这些工具的分工也越来越清楚。ChatGPT Plus 更适合综合开发辅助比如拆问题、写脚本、解释报错、整理 README。Claude Pro 更适合长代码、长文档、复杂逻辑分析。Gemini Advanced 的优势更偏 Google 生态和资料流现在 Gemini 3.5 Flash 又明显往 agents 和 coding 方向靠。Grok 更适合实时信息、技术趋势和外部讨论观察。Cursor 更贴近编辑器和工程上下文尤其是多仓库任务。Kiro 更像是把需求、规格和任务执行串起来适合在写代码前先把开发路径理清。但程序员不要被工具名字带着跑。你真正要看的不是哪个工具最火而是你每天最容易在哪里浪费时间。如果你浪费在“代码太长看不懂”就找长上下文能力强的。如果你浪费在“需求没拆清楚”就找能做规格和任务分析的。如果你浪费在“多个仓库来回切”就关注多仓库上下文。如果你浪费在“写完才发现边界漏了”就让 AI 先做 Review checklist。工具越多越要回到自己的流程。还有一个现实问题国内开发者开这些 AI 会员经常不是卡在怎么用而是卡在怎么订阅。海外信用卡失败、虚拟卡扣款不稳定、App Store 换区、账单地址、不同平台的订阅入口这些东西看起来不是技术问题但真的会消耗时间。如果你已经确定要长期用 ChatGPT Plus、Claude Pro、Grok、Gemini Advanced、Kiro、Cursor 这类工具又不想把精力耗在支付失败和订阅流程上可以了解 gpt68.com。它是 AI会员充值平台官网显示支持 ChatGPT Plus、Claude Pro、Gemini、Super Grok、Cursor、Kiro 等主流 AI 工具会员充值并且页面明确说明自己是第三方 AI 会员充值服务平台不是 OpenAI、Anthropic、Google、xAI、Cursor、Kiro 官方网站或授权合作方。这类平台解决的是充值入口和流程问题不是替代工具本身。工具怎么用还是要回到你的开发流程里。最后说一个我自己的判断。未来 AI 编程工具真正拉开差距的不会只是“谁补全更快”。而是谁更懂项目上下文。谁更能拆需求。谁更能发现边界问题。谁能减少开发者在代码、文档、终端、仓库、需求之间反复切换。谁能让程序员少返工。程序员用 AI不该只问“它会不会写代码”更该问“它能不能让我少踩一次坑”这才是 AI 编程工具越来越强之后真正值得关注的地方。