为什么 Prompt Engineering 正在过时，而 Context Engineering 正在接管一切：不同角色的人应如何应对-尧图企业网站定制

最近在看一些关于 AI 工程的讨论时我注意到一个变化越来越多的人不再谈 Prompt Engineering转而开始谈一个新词——Context Engineering。这件事最早引起我注意是 2025 年 6 月 Andrej Karpathy 发的一条推文。他说Context engineering is the delicate art and science of filling the context window with just the right information for the next step.翻译过来就是Context Engineering 是一门精细的艺术和科学核心是在上下文窗口里填入恰到好处的信息以支持模型的下一步。紧接着 Shopify 的 CEO Tobi Lütke 跟进回应说这个词「更准确地描述了核心技能」。再往前翻IEEE Spectrum 更早就刊文宣告AI Prompt Engineering Is Dead。一个词的更替背后通常代表着某种更深层的认知转变。我开始认真去研究这件事越看越觉得它不是换了个术语那么简单。一、这些人到底在说什么先仔细看看 Karpathy 的原话。他解释了为什么「prompt」这个词不再够用人们一提到 prompt就联想到「写一句话给 AI」但在真实的生产系统里工作远比这复杂得多。你要决定塞进上下文窗口的全部内容——检索到的文档、对话历史、工具调用结果、用户状态、记忆、系统指令。这些加起来才是模型「看到」的世界。然后他说了一句我觉得很关键的话太少或形式不对模型没有足够的上下文来做出好回答太多或太不相关成本上升性能反而下降。做好这件事远不是写一句漂亮的 prompt 那么简单。Shopify CEO Tobi Lütke 的回应也值得细看。他用了一个很精确的措辞「为任务提供所有必要的上下文让LLM有可能解决它」。注意他的用词有可能解决。不是「让 LLM 回答得更漂亮」而是「让任务在逻辑上变得可解」。这个区别很关键Context Engineering 的目标不是润色输出而是确保模型有足够的信息基础来完成任务。IEEE 的那篇文章走得更远。核心论点是模型本身已经能比人类更好地优化 prompt 措辞。当模型自己都能改写 prompt 了你手动调措辞的边际收益就非常小了。真正的杠杆点已经从「怎么问」转向了「看什么」。这三个声音来自不同方向——学术界、商业领袖、技术媒体但指向了同一个结论AI 工程的核心战场正在从 prompt 转移到「context」****。二、先搞清楚上下文窗口里到底装了什么这里有一个很容易被忽略的事实值得展开讲。当大多数人想到 prompt 的时候脑海里浮现的画面是 ChatGPT 的输入框你打一句话进去模型回一段话出来。但在真实的生产级 AI 系统中用户输入的那句话只是冰山一角。一个典型的生产系统当模型开始推理的时候它看到的完整上下文大致是这样的组成部分占上下文窗口比例说明系统指令SystemPrompt5-10%角色定义、行为准则、输出格式要求工具描述 ToolDefinitions5-15%可调用的 API、函数签名、参数说明检索结果 RAG30-50%从知识库检索到的相关文档片段对话历史10-20%之前的对话轮次记忆与状态5-10%用户偏好、会话状态、长期记忆用户输入5-10%用户实际打的那句话用户输入通常只占上下文窗口的 5-10%。你精心打磨的那句 prompt在模型看到的整个信息空间里只是一小片。剩下 80%-90% 的空间——检索结果、对话历史、工具定义、系统指令——才是真正决定输出质量的变量。这就是为什么同一句 prompt在不同系统里效果天差地别。你觉得是 prompt 的问题其实是 context 的问题。三、Context Engineering的定义Context Engineering上下文工程系统性地设计和管理 LLM 在每次推理时「看到」的全部信息——包括系统指令、对话历史、检索到的文档、工具描述与输出、记忆、用户状态等——而不仅仅是用户输入的那句话。如果用考试来类比Prompt Engineering是「写考题」——怎么把题目出得更清楚、更精确Context Engineering是「设计整个考场」——灯光亮不亮、桌上有没有参考资料、参考资料是不是对的、考生拿到的是不是自己的卷子、答题时间够不够、监考规则是什么考题写得再精妙如果考场没灯、参考资料是错的、考生拿到的是别人的卷子结果不会好。反过来考场设计得当即使考题再难考生也能发挥正常水平。四、它和 RAG、Prompt Engineering 是什么关系看到这里你可能会想这不就是 RAG 吗或者更复杂一点的 RAG不完全是。RAG 是 Context Engineering 的一个重要组成部分它解决「从外部知识库检索信息并注入上下文」这一步。但 Context Engineering 的范围要广得多RAG 关注的是「检索什么」Context Engineering 关注的是「整个上下文窗口里放什么、不放什么、怎么组织、什么时候更新」Prompt Engineering 关注的是「怎么问」Context Engineering 关注的是「给什么看」Context Engineering 把两者都包含进来再加上记忆管理、状态追踪、工具编排、上下文压缩等形成一个完整的信息管道设计用一个包含关系来理解Prompt Engineering 和 RAG 都是 Context Engineering 的子集不是反过来。这个认知决定了你应该把精力花在哪里。如果你的系统效果不好不应该只去调 prompt 或者只去优化 RAG应该审视整个上下文系统指令对不对工具描述太多了对话历史太长了不同类型的信息混在一起了五、为什么现在火起来从玩具到生产的必然接下来讲为什么这件事在「**现在」**变得特别重要。1. 40% 的失败不是模型的错这里有一组值得认真消化的数据超过 40% 的 AI 项目失败源于上下文问题而非模型能力不足contextengineering.ai 数据42% 的企业 AI 项目在 2025 年被废弃比 2024 年的 17% 暴涨了 25 个百分点Gartner60% 的企业 AI 投资未产生实质性回报Brent Johnson/Substack 综合数据Gartner 预测到 2026 年组织将废弃 60% 的 AI 项目主要原因是缺乏组织上下文仔细看这些数字它们指向同一个结论AI 项目大规模失败的根因不是模型不够强而是没给模型足够好的上下文。这很反直觉。大多数团队在 AI 项目遇到问题时的第一反应是「换更大的模型」「加更多参数」「用更贵的 API」。但现实是一个拿到正确上下文的中等模型往往比一个拿到垃圾上下文的顶级模型表现更好。2. 80% 是一条生死线另一组关键数据来自 Gartner 和 Atlan 的研究上下文准确率 80%用户拒绝使用 AI 系统。不信任、体验差、宁可手动上下文准确率 80%采用率开始加速。用户觉得「靠谱了」愿意依赖80% 是一个 tipping point。从 70% 到 80%靠 prompt 调优能做到一部分。但从 80% 往 90% 走几乎完全取决于上下文的系统设计——检索准不准、历史管不管得好、工具输出可不可靠、无关信息有没有被过滤掉。这就是 Context Engineering 从「nice to have」变成「must have」的根本原因它是跨越 80% 可用性门槛的关键。3. Anthropic 的验证结构化上下文减少 40% 幻觉2025 年 9 月Anthropic 发了一篇影响很大的博文Effective Context Engineering for AI Agents。核心发现通过结构化上下文设计明确分区、合理排序、及时检索幻觉率可以降低 40% 以上。注意这不是靠 prompt 措辞做到的。这是靠信息架构做到的。2026 年 2 月一项覆盖 9,649 次实验的同行评审研究进一步确认上下文质量比 prompt 本身更重要。结构化上下文可以在前沿模型上再提升 2.7% 的准确率。2.7% 听起来不多但在已经 90% 准确率的前沿模型上这个提升非常显著——相当于把「偶尔出错」变成「几乎不出错」。六、进化时间线这不是一个新概念是一次认知收敛如果回头看这几年 AI 工程的进化会发现 Context Engineering 不是凭空出现的而是一步步走过来的。这条线值得完整看一遍因为它揭示了杠杆****点是怎么逐步下移的。2022 年Prompt Engineering 元年ChatGPT 发布prompt 工程师成为热词。大家发现同一个模型问法不同效果差异巨大。于是出现了大量 prompt 模板、技巧、课程。核心方法论是 Chain-of-Thought、Few-shot、角色扮演等本质上是在优化「那一句话」。这个阶段的范式是一个用户一次对话一句精心设计的指令。2023 年RAG 兴起团队开始把大模型接入企业知识库RAG 成为落地标配。这一步的核心突破是模型不再只靠参数记忆而是可以「开卷考试」。但 RAG 也带来了新问题分块不好就检索不到、检索到了垃圾模型照样瞎编、多文档拼接格式混乱……人们开始意识到问题不只是「问什么」更是「给模型看什么」。2024 年Agent 起飞AutoGPT、Devin、各种 Agent 框架涌现。AI 不再是单次问答而是要多步推理、调用工具、长时间运行。这对上下文管理提出了全新挑战上下文越来越长token 成本暴增对话历史堆积关键信息被淹没工具调用的结果需要即时注入多 Agent 协作时谁该看到什么信息在这个阶段「上下文管理」从一个技术细节变成了架构核心问题。2025 年Context Engineering 正名Karpathy 的推文是一个标志性时刻但它更像是一个「命名仪式」——行业已经在做的事情终于有了一个准确的名字。这一年发生的关键事件Anthropic 发布 MCP统一 AI 连接外部工具和数据的标准Anthropic 发布 Context Engineering 博文系统阐述上下文管理策略Microsoft 发布 ACEAgentic Context Engineering框架被 ICLR 2026 收录多家企业开始设立「Context Engineer」岗位2026 年ContextGraph时代Gartner 预测到 2028 年超过 50% 的 AI Agent 系统将使用 Context****Graph知识图谱的进化形态不仅记录「什么是什么」还记录「为什么这么决策」「怎么做出来的」。同时Gartner 也警告到 2028 年60% 仅依赖MCP而缺乏语义基础的 Agent 项目将失败。光有连接还不够还需要有组织化的上下文理解能力。把这条线拉出来看每一步的杠杆点都在下移——从优化提问措辞到优化检索内容到优化整个信息系统。七、这对不同人意味着什么Context Engineering 不是一个只有开发者需要关心的技术概念。它影响的是整个 AI 产品的决策链。1. 对 VC 和投资人上下文层Context Layer正在成为新一代 AI 基础设施。过去几年 AI 投资集中在模型层大模型、推理优化和应用层SaaS、copilot。但中间有一层被低估了把正确的信息在正确的时间送给正确的模型的那一层。这一层包括向量数据库Pinecone、Weaviate、Qdrant、记忆管理Mem0、Zep、检索优化Cohere Rerank、上下文编排LangChain、LlamaIndex、治理审计Atlan、Galileo。**当 42% 的 AI 项目因为上下文问题失败时解决上下文问题的公司就有了结构性机会。**这不是「锦上添花」的效率工具而是「没有就做不出来」的基础设施。2. 对 AI 产品经理需求定义需要升级——不能只写「接个大模型」还要定义上下文策略。和开发团队沟通时PM 需要能回答这些问题模型需要看到哪些信息才能完成这个任务这些信息从哪来怎么检索多久更新上下文窗口的 token 预算怎么分配如何评估上下文质量而不只是最终答案质量多轮对话时历史怎么管理什么时候压缩Context Engineering 正在PRD中催生一个新板块上下文需求****和功能需求、性能需求并列。3. 对架构师信息管道设计成为架构核心。以前架构师关注的是计算流请求怎么走、服务怎么拆、数据怎么存。现在还需要关注信息流上下文怎么组装、怎么在组件之间传递、怎么在多 Agent 之间隔离或共享。Anthropic 在博文中提出的四大策略——Write写入外部存储、Select精准检索、Compress智能压缩、Isolate分区管理——正在成为架构设计的新参考框架。后面会单独一篇文章讲解有兴趣的朋友可以关注我4. 对开发者Context Engineering 正在取代 Prompt Engineering 成为核心技能。这不是说 prompt 不重要了而是说它变成了更大系统中的一个环节。开发者需要掌握的新技能包括设计检索管道不只是调 API而是理解分块、嵌入、混合检索、重排序管理上下文窗口token 预算分配、注意力偏好、压缩策略构建记忆系统工作记忆、情景记忆、语义记忆的分层设计评估上下文质量Context Precision、Context Recall不只是答案指标一个趋势是会写好 prompt 的人有很多但能设计好整个上下文系统的人目前非常稀缺。八、几个常见的误解最后澄清几个我在讨论中经常看到的误解。❌「Context Engineering 不就是 Prompt Engineering 换了个名字吗」不是。Prompt Engineering 关注的是用户输入的那 5-10%Context Engineering 管理的是整个 100%。一个是写一句话的技巧一个是设计信息系统的工程。类比写 SQL 查询语句是一个技能设计整个数据库架构是另一个技能。它们有交集但不是一回事。❌「大模型上下文窗口越来越长不需要管理了吧」恰恰相反。上下文越长管理越重要。研究表明当上下文窗口利用率超过 85% 时模型性能会下降约 23%。200K token 的超长上下文会产生「注意力盲区」中间的信息被系统性忽略即「Lost in the Middle」问题。窗口大了不等于能用好就像图书馆大了不等于能找到书。❌「我用了 RAG 就算是做 Context Engineering 了。」RAG 是 Context Engineering 的重要组成部分但不是全部。RAG 解决的是「检索并注入外部知识」Context Engineering 还包括记忆管理、对话历史压缩、工具输出整合、多 Agent 上下文隔离、上下文质量评估等。只做 RAG 就像只装了发动机但没装变速箱——能转但跑不远。最后回到 Karpathy 那条推文。他说的其实很简单模型在推理的那一刻看到了什么信息决定了它能给出什么回答。这些信息太少、太多、太乱、太不相关都会导致结果不好。而系统性地管理这些信息远比写一句漂亮的 prompt 重要得多也复杂得多。这也是我接下来想深入写的方向。Context Engineering 到底怎么做技术上有哪些策略Agent 场景下有什么特殊挑战商业上意味着什么怎么落地学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻

GD32F407开发板硬件设计解析：从原理图到模块化接口的实战指南

关于举报无名创新设计软件付费代做飞跃雷区组竞赛的事情完整详细经过

国产自研AI搜索优化引擎：小陌GEO+龙虾机器人，全域大模型占位实战解析

DISMTools教程：使用预安装环境(PE)进行系统维护的完整指南

完整掌握Kotlin-Coroutines-Android-Examples：面向Android开发者的协程教程

Kotlin协程实战指南：10个Android开发必学应用案例解析

Stable-Diffusion-NCNN Android移动端实现：在手机上运行AI绘画的完整方案

告别YOLO，试试DETR：用Facebook的Transformer模型在自定义数据集上做目标检测

Buckets CMS设计构建系统：如何实现实时主题编辑与版本控制的终极指南

Unity ML-Agents 环境配置避坑指南：Python+CUDA+Unity 版本精准匹配

毕业设计 yolov11骨折检测医疗辅助系统（源码+论文）

别再死记硬背了！用5个生活化比喻彻底搞懂Linux进程的fork、exec和wait

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势