如果AI Agent是操作系统MCP就是USB协议Tools是插在外设上的功能按钮Skills就是应用程序。开篇一位架构师的困惑上周我在技术交流群里看到这样一段对话开发者A“我们团队正在构建企业级AI Agent系统但是MCP、Tools、Skills这三个概念把我搞晕了。它们到底有什么区别什么时候该用哪个”开发者B“我也在纠结这个问题。有人说MCP已经过时了应该全用Skills也有人说Skills只是MCP的补充。”开发者C“面试官昨天问我这个问题我答得一塌糊涂…”这个困惑我相信很多开发者和架构师都遇到过。AI Agent工具圈每隔几周就会冒出新概念每次新东西出来就有人喊旧的已死。但真相是MCP、Tools、Skills根本不是竞争关系而是不同层次的能力扩展机制。今天我们就用一篇文章彻底讲清楚这三者的区别、联系和最佳实践。第一部分AI Agent的能力困境1.1 大模型的先天缺陷在深入讨论之前我们先要理解一个根本问题为什么AI Agent需要能力扩展想象一下你招聘了一位超级聪明的实习生。这位实习生• ✅ 读过互联网上几乎所有公开的知识• ✅ 能写代码、能分析数据、能写文章• ✅ 精通多国语言理解能力超强但是这位实习生有一个致命问题• ❌不知道你们公司的内部流程• ❌无法访问公司的数据库和系统• ❌不会使用你们团队的专用工具• ❌知识停留在训练截止日期不知道最新动态这就是大模型的先天缺陷知识封闭、能力有限、无法行动。为了解决这个问题业界提出了三种主要的扩展方式Tools工具给AI一双手让它能执行具体操作MCPModel Context Protocol定义一套标准协议让AI能即插即用地连接任何工具Skills技能给AI一本操作手册教它怎么完成特定任务1.2 从Function Calling到Agent能力扩展要理解这三者的关系我们需要回顾一下技术演进史。第一代Function Calling函数调用2023年初OpenAI推出了Function Calling功能。它的核心思想是用户输入 LLM判断需要调用函数 返回函数名和参数 外部系统执行 返回结果给LLM但Function Calling有一个问题每个AI应用都要自己实现与每个工具的集成。假设有10个AI应用要连接20个工具理论上需要10×20200个定制集成。每家都在重复造轮子开发者苦不堪言。第二代MCPModel Context Protocol2024年11月Anthropic开源了MCP。它做的事情和USB-C统一充电接口一模一样定义一套标准协议让任何AI都能即插即用地连接任何工具。有了MCP10个AI应用20个工具102030个MCP实现而不是200个定制集成。数学上叫把M×N问题变成了MN问题实践中意味着开发成本断崖式下降。第三代Skills技能2025年10月Anthropic推出了Agent Skills。它解决的是另一个层面的问题不是让AI能连接什么而是教AI怎么思考和做事。Skills将专业知识、工作流程、最佳实践打包成AI能理解的操作手册让AI在特定领域变得专业。第二部分深度解析MCP——AI世界的USB协议2.1 MCP是什么**MCPModel Context Protocol模型上下文协议**是Anthropic在2024年11月发布的开源协议用于标准化AI应用与外部系统的交互方式。官方的比喻是AI应用的USB-C接口——就像USB-C提供了一种通用的方式连接各种设备MCP提供了一种通用的方式连接各种工具和数据源。关键点MCP不是Claude专属的。它是一个开放协议理论上任何AI应用都可以实现。截至2026年初已经被多个平台采用•AnthropicClaude Desktop、Claude Code•OpenAIChatGPT、Agents SDK、Responses API•GoogleGemini SDK•MicrosoftAzure AI Services•开发工具Zed、Replit、Codeium、Sourcegraph到2026年2月已经有超过1000个开源MCP连接器。2.2 MCP的架构设计MCP基于JSON-RPC 2.0协议采用客户端-主机-服务器Client-Host-Server架构•Host主机用户直接交互的应用Claude Desktop、Cursor、Windsurf•Client客户端Host应用中管理与特定Server通信的组件•Server服务器连接外部系统的桥梁数据库、API、本地文件等这个架构的精妙之处在于Host不需要知道Server的具体实现细节只需要遵循MCP协议即可。2.3 MCP的三个核心原语MCP定义了三种Server可以暴露的原语1. Tools工具——模型控制Tools是可执行的函数AI可以调用来执行操作。关键特征• ✅ 有明确的输入输出schema• ✅ 执行具体操作读、写、更新、删除等• ✅ 由AI自主决定何时调用2. Resources资源——应用控制Resources是数据源为AI提供上下文信息。关键特征• ✅ 提供静态或动态数据• ✅ 不执行操作只提供信息• ✅ 由应用而非AI控制加载时机3. Prompts提示——用户控制Prompts是预定义的提示模板帮助结构化与AI的交互。eview code.py关键特征• ✅ 预定义的工作流程• ✅ 由用户显式触发• ✅ 可以参数化2.4 MCP vs Function Calling很多人会问MCP和OpenAI的Function Calling、Anthropic的Tool Use有什么区别Function Calling是LLM的能力——把自然语言转换成结构化的函数调用请求。LLM本身不执行函数只是告诉你应该调用什么函数参数是什么。MCP是在Function Calling之上的协议层——它标准化了函数在哪里、怎么调用、怎么发现。两者的关系Function Calling解决决定做什么MCP解决怎么做到。2.5 MCP的致命问题上下文爆炸但MCP有一个严重的副作用吃掉你的上下文窗口。每个MCP Server连接到AI时必须把所有工具的定义名称、描述、参数、示例一次性塞进上下文。一个工具的定义大概500-800 tokens一个MCP Server通常有10-20个工具。来看几个真实数据有开发者配了7个MCP Server还没开始对话上下文就被吃掉了67,000 tokens——占AI上下文窗口的33%。更夸张的案例是82,000 tokens占41%。这意味着什么你问AI22等于几它回答4只需要5个token但工具定义已经消耗了15,000 tokens。简单问题的成本被放大了3000倍。更糟糕的是当上下文被工具定义挤占后AI选错工具、传错参数的概率会显著上升。实践中连接2-3个以上的MCP Server工具使用准确性就会明显下降。2.6 MCP的解决方案Tool SearchAnthropic意识到了这个问题。2026年1月Claude Code推出了Tool Search功能• MCP工具不再预加载而是按需发现• 当工具定义超过上下文的10%时自动启用• AI需要用某个工具时先搜索再加载效果立竿见影从77,000 tokens降到8,700 tokens减少85%。但这只是在给MCP打补丁。问题的根源在于MCP的设计假设是把所有工具摆出来让AI挑这在工具数量少的时候没问题工具多了就撑不住。第三部分深度解析Skills——AI的操作手册3.1 Skills是什么Skill全称Agent Skill是Anthropic在2025年10月推出的特性。官方定义“Skills are organized folders of instructions, scripts, and resources that agents can discover and load dynamically to perform better at specific tasks.”翻译一下Skill是一个文件夹里面放着指令、脚本和资源AI会根据需要自动发现和加载。Skill在架构层级上和MCP不同。用Anthropic的话说“Skills are at the prompt/knowledge layer, whereas MCP is at the integration layer.”Skill是提示/知识层MCP是集成层。两者解决不同层面的问题。打个比方•MCP是AI的手能触碰外部世界•Skill是AI的技能书知道怎么做某件事你需要两者配合MCP让AI能连接数据库Skill教AI怎么分析查询结果。3.2 Skills的核心设计渐进式披露Skill最精妙的设计是渐进式披露Progressive Disclosure。这是Anthropic在上下文工程Context Engineering领域的重要实践。官方的比喻“Like a well-organized manual that starts with a table of contents, then specific chapters, and finally a detailed appendix.”就像一本组织良好的手册先看目录再翻到相关章节最后查阅附录。Skill分三层加载第1层元数据始终加载• Skill名称 描述• 约100 tokens• 就像浏览书架上的书名和简介不打开书第2层核心指令按需加载• SKILL.md完整内容• 通常5k tokens• 当AI判断某个Skill与任务相关时才读取第3层参考资料深度按需加载• reference.md、脚本、模板等• 理论上可以包含无限内容• 只有任务真正需要时才加载这个设计的好处是什么传统方式比如MCP在会话开始时就把所有信息加载到上下文。如果你有10个MCP Server每个暴露5个工具那就是50个工具定义——可能消耗数千甚至上万Token。Skill的渐进式加载让你可以有几十个Skill但同时只加载一两个。上下文效率大幅提升。用官方的话说“This means that the amount of context that can be bundled into a skill is effectively unbounded.”理论上单个Skill可以包含无限量的知识——因为只有需要的部分才会被加载。3.3 Skills的文件结构一个标准的Skill长这样SKILL.md是核心必须包含YAML格式的元数据---name:code-reviewdescription: Review code for bugs, security issues, and style violations. Use when asked to review code, check for bugs, or audit PRs.---# Code Review Skill## InstructionsWhenreviewingcode,follow these steps:1.Firstcheckforsecurityvulnerabilities...2.Thencheckforperformanceissues...3.Finallycheckforcodestyle...## ExamplesExample 1:Input: def foo(x):returnx1Output:Missingtypehints,consideraddingtype annotations.关键字段•nameSkill的唯一标识小写字母数字连字符最多64字符•description描述做什么、什么时候用最多1024字符description的质量直接决定Skill能不能被正确触发。3.4 Skills的触发机制Skill是自动触发的这是它和Slash Command的关键区别。工作流程扫描阶段Claude读取所有Skill的元数据名称描述匹配阶段将用户请求与Skill描述进行语义匹配加载阶段如果匹配成功加载完整的SKILL.md执行阶段按照Skill里的指令执行任务按需加载支持文件用户不需要显式调用。比如你有一个code-reviewSkill用户说帮我review这段代码Claude会自动匹配并加载。Skill的本质是什么技术上Skill是一个元工具Meta-toolSkill不是执行具体动作而是注入指令到对话历史中动态修改Claude的执行环境。3.5 Skills的杀手锏自带脚本Skills还有一个很多人忽略的能力它可以自带可执行脚本。一个典型的Skill文件夹结构是这样的关键来了当AI运行scripts/validate.py时脚本代码本身不会加载到上下文只有执行结果会返回。这是什么概念假设你有一个500行的Python脚本用来处理PDF表单。用传统方式AI要么自己写代码消耗大量tokens生成要么读取你的脚本再执行脚本内容占用上下文。而用SkillsAI直接运行预写好的脚本整个过程可能只消耗50 tokens的输出结果。脚本执行 零上下文成本 确定性结果更重要的是这些脚本通过Agent内置的bash工具执行不需要MCP。Skills支持的脚本语言包括Python、Bash、JavaScript等基本上你系统能跑的都能用。这意味着• ✅ 文件读写Skill脚本搞定• ✅ 数据处理Skill脚本搞定• ✅ 格式转换Skill脚本搞定• ✅ 本地API调用Skill脚本搞定3.6 写好Skill的关键description的质量Skill能不能被正确触发90%取决于description写得好不好。❌ 差的descriptiondescription: Helps with data太宽泛Claude不知道什么时候该用。✅ 好的descriptiondescription: Analyze Excel spreadsheets, generate pivot tables, and create charts. Use when working with Excel files (.xlsx), spreadsheets, or tabular data analysis. Triggers on: analyze spreadsheet, create pivot table, Excel chart好的description应该包含做什么具体的能力描述什么时候用明确的触发场景触发词用户可能说的关键词第四部分MCP vs Skills——终极对比4.1 架构层级对比现在我们可以从架构层级来理解两者的区别Skill在上层知识层MCP在下层集成层。两者不是替代关系而是互补关系。你可以• 用MCP连接GitHub• 用Skill教AI如何按照团队规范做Code Review4.2 详细对比表维度MCPSkills核心作用连接外部系统编码专业知识和方法论架构层级集成层底层知识层上层类比USB协议应用程序问的问题“AI能访问什么”“AI知道怎么做什么”协议基础JSON-RPC 2.0Markdown文件跨平台✅ 是开放协议❌ 否Anthropic专属触发方式持久连接随时可用语义匹配自动触发Token消耗❌ 高工具定义始终占用✅ 低渐进式加载能访问外部系统✅ 可以❌ 不能需配合MCP或内置工具实现复杂度高需要运行Server低写Markdown就行适用场景查数据库、调API代码审查、文档生成分发方式URL接入面向外部用户文件复制面向内部团队可执行性API调用脚本执行安全性外部内容带来prompt injection风险Skill文件本身可能包含恶意指令4.3 什么时候用MCP什么时候用Skills✅ 用MCP的场景需要访问外部数据数据库查询、API调用、文件系统访问需要操作外部系统创建GitHub Issue、发送Slack消息、执行SQL需要实时信息监控系统状态、查看日志、搜索引擎结果需要跨平台复用同一个工具在Claude Desktop、Cursor、其他支持MCP的应用中使用对外提供服务做一个服务让外部用户都能用✅ 用Skills的场景重复性的工作流程代码审查、文档生成、数据分析公司内部规范代码风格、提交规范、文档格式需要多步骤的复杂任务需要详细指导的专业任务团队共享的最佳实践标准化的操作流程Token敏感场景需要大量知识但不想一直占用上下文优化自己或团队的工作流本地自动化4.4 组合使用最佳实践很多时候两者是配合使用的MCP负责能访问什么Skill负责怎么做。第五部分真实案例——从MCP到Skills的演进5.1 案例自动发布X Article这是一个真实发生的演进过程完美展示了从MCP到Skills的转变。需求把Markdown文章自动发布到XTwitter的长文功能X Article。方案一Playwright MCP王树义老师开发了x-article-publisher-skill流程是这样的提示词很简洁功能也很强大。但问题来了上下文消耗得飞快。Playwright MCP有22个工具光工具定义就占用约8,000-10,000 tokens。更要命的是每次浏览器交互MCP都要返回页面的accessibility tree无障碍树快照——这是为了让AI理解当前页面状态。一个复杂页面的快照可能就是几千tokens。发布一篇文章可能需要打开页面、等待加载、点击编辑器、粘贴内容、上传图片、调整位置、保存草稿……每一步都是一次MCP交互每一次交互都在消耗上下文。结果一篇文章发完上下文可能已经用掉50,000 tokens。方案二Skills CDP脚本改进版本baoyu-post-to-x把Playwright MCP部分完全改成了脚本核心变化脚本直接调用Chrome CDPChrome DevTools Protocol绕过MCP传入Markdown文件路径脚本自己解析内容脚本自己完成所有浏览器操作打开页面、填充内容、上传图片、保存草稿只返回最终结果给Agent“发布成功草稿链接xxx”整个过程AI只需要做一件事调用脚本传入文件路径。上下文消耗可能只有几百tokens。对比分析Playwright MCPSkills CDP脚本工具定义~10,000 tokens22个工具0脚本不需要工具定义每次交互返回页面快照数千tokens无中间交互AI参与度每一步都要AI决策只需调用一次脚本总消耗50,000 tokens几百tokens关键洞察MCP的设计是让AI一步步操作每一步都要理解、决策、执行。而脚本的设计是把整个流程封装起来AI只需要说开始和结束。这就是为什么即使MCP支持了Tool Search按需加载工具上下文问题也没有根本解决——因为工具定义只是一部分真正的大头是交互过程中产生的中间结果。而Skills的脚本执行模式天然避开了这个问题脚本代码不进入上下文中间过程不进入上下文只有最终结果进入上下文。第六部分Tools的定位——MCP的能力单元6.1 Tools是什么在前面的讨论中我们一直在说MCP和Skills那么Tools到底扮演什么角色Tools是MCP暴露的具体能力单元。回想一下MCP的三个核心原语Tools工具可执行的函数Resources资源数据源Prompts提示预定义的提示模板Tools是其中最常用、最核心的部分。6.2 Tools vs MCP的关系可以把MCP理解为一个协议框架而Tools是这个框架中具体的能力实现。类比•MCP HTTP协议•Tools RESTful API端点HTTP定义了请求响应的标准而具体的API端点如GET /users、POST /articles才是实际的能力。一个MCP Server通常会暴露多个Tools每个Tool都有• 名称name• 描述description• 参数schemaparameters6.3 Tools vs Skills的区别虽然Tools和Skills都能扩展AI能力但它们的本质完全不同Tools工具• ✅ 是执行单元执行具体操作• ✅ 有明确的输入输出schema• ✅确定性执行同样的输入得到同样的输出• ✅ 由AI自主决定何时调用• ✅ 通常是API调用或函数执行Skills技能• ✅ 是知识单元提供方法论和指导• ✅ 用自然语言描述• ✅非确定性AI需要理解并执行指令• ✅自动触发基于语义匹配• ✅ 通常是工作流程或最佳实践打个比方厨具是执行工具菜谱是操作指南。两者配合才能做出一道好菜。第七部分未来趋势与最佳实践7.1 随着Skills普及MCP的需求会大幅减少这是一个正在发生的趋势。想想看什么时候你真正需要MCP需要MCP的场景不需要MCP的场景事实上Anthropic的工程博客提到他们用代码执行MCP的方法把一个150,000 token的工作流压缩到了2,000 tokens——核心思路就是让AI写代码调用工具而不是预加载所有工具定义。这正是Skills的设计方向用脚本封装能力用渐进式披露管理知识最大限度减少上下文消耗。未来的格局可能是这样的少数通用MCP Server处理远程连接数据库、云API、SaaS集成大量Skills编码专业知识和本地工作流两者在必要时协作但Skills会承担绝大部分教AI怎么做事的工作7.2 给开发者和架构师的建议对于个人开发者优先学习Skills它更轻量、更高效、更容易上手用Skills封装你的工作流程把重复性任务自动化只在必须连接远程系统时才用MCP避免不必要的上下文消耗复杂逻辑用脚本不要让AI一步步操作对于团队/企业建立Skills库将团队的最佳实践、代码规范、工作流程打包成Skills用Git管理Skills版本控制、代码审查、持续集成MCP用于对外服务如果要给客户提供AI服务用MCP标准化接口两者结合使用MCP连接外部系统Skills编码内部流程对于架构师理解架构层级MCP在集成层Skills在知识层设计混合架构MCP Skills 内置工具关注Token效率渐进式披露优于预加载考虑安全性审查MCP Server和Skills的来源7.3 三个关键问题帮你做决策到底选MCP还是Skills问自己三个问题1. 谁来用2. 怎么分发3. 要解决什么问题结尾回到最初的问题所以回到文章开头那位开发者的问题“MCP、Tools、Skills到底有什么区别”现在我们可以给出清晰的答案一句话总结•MCP是AI世界的USB协议定义了AI与外部世界的连接标准•Tools是MCP暴露的具体能力是AI可以调用的函数•Skills是AI的操作手册教AI怎么完成特定任务它们的关系•MCP vs Skills不是竞争关系而是不同层次的能力集成层 vs 知识层•MCP vs Tools框架 vs 实现MCP是协议Tools是协议中的能力单元•Tools vs Skills执行工具 vs 操作指南一个是能做什么一个是怎么做最佳实践用Skills编码你的领域知识用MCP连接外部服务。比如你们公司有一套特定的工作流程先查这个系统再查那个系统按某个顺序处理。这种领域知识用Skills写出来让AI理解。但具体连接那些系统的能力靠MCP提供。两层配合各司其职。最后的建议如果你只能选一个先学选Skills。它更轻量、更高效、更容易上手能解决你日常遇到的大部分问题。但如果你想构建企业级AI系统两者都要掌握。因为一个成熟的AI Agent系统两者都需要。普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事02适学人群应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】
MCP、Tools、Skills大模型能力扩展机制详解:小白程序员必备收藏指南
如果AI Agent是操作系统MCP就是USB协议Tools是插在外设上的功能按钮Skills就是应用程序。开篇一位架构师的困惑上周我在技术交流群里看到这样一段对话开发者A“我们团队正在构建企业级AI Agent系统但是MCP、Tools、Skills这三个概念把我搞晕了。它们到底有什么区别什么时候该用哪个”开发者B“我也在纠结这个问题。有人说MCP已经过时了应该全用Skills也有人说Skills只是MCP的补充。”开发者C“面试官昨天问我这个问题我答得一塌糊涂…”这个困惑我相信很多开发者和架构师都遇到过。AI Agent工具圈每隔几周就会冒出新概念每次新东西出来就有人喊旧的已死。但真相是MCP、Tools、Skills根本不是竞争关系而是不同层次的能力扩展机制。今天我们就用一篇文章彻底讲清楚这三者的区别、联系和最佳实践。第一部分AI Agent的能力困境1.1 大模型的先天缺陷在深入讨论之前我们先要理解一个根本问题为什么AI Agent需要能力扩展想象一下你招聘了一位超级聪明的实习生。这位实习生• ✅ 读过互联网上几乎所有公开的知识• ✅ 能写代码、能分析数据、能写文章• ✅ 精通多国语言理解能力超强但是这位实习生有一个致命问题• ❌不知道你们公司的内部流程• ❌无法访问公司的数据库和系统• ❌不会使用你们团队的专用工具• ❌知识停留在训练截止日期不知道最新动态这就是大模型的先天缺陷知识封闭、能力有限、无法行动。为了解决这个问题业界提出了三种主要的扩展方式Tools工具给AI一双手让它能执行具体操作MCPModel Context Protocol定义一套标准协议让AI能即插即用地连接任何工具Skills技能给AI一本操作手册教它怎么完成特定任务1.2 从Function Calling到Agent能力扩展要理解这三者的关系我们需要回顾一下技术演进史。第一代Function Calling函数调用2023年初OpenAI推出了Function Calling功能。它的核心思想是用户输入 LLM判断需要调用函数 返回函数名和参数 外部系统执行 返回结果给LLM但Function Calling有一个问题每个AI应用都要自己实现与每个工具的集成。假设有10个AI应用要连接20个工具理论上需要10×20200个定制集成。每家都在重复造轮子开发者苦不堪言。第二代MCPModel Context Protocol2024年11月Anthropic开源了MCP。它做的事情和USB-C统一充电接口一模一样定义一套标准协议让任何AI都能即插即用地连接任何工具。有了MCP10个AI应用20个工具102030个MCP实现而不是200个定制集成。数学上叫把M×N问题变成了MN问题实践中意味着开发成本断崖式下降。第三代Skills技能2025年10月Anthropic推出了Agent Skills。它解决的是另一个层面的问题不是让AI能连接什么而是教AI怎么思考和做事。Skills将专业知识、工作流程、最佳实践打包成AI能理解的操作手册让AI在特定领域变得专业。第二部分深度解析MCP——AI世界的USB协议2.1 MCP是什么**MCPModel Context Protocol模型上下文协议**是Anthropic在2024年11月发布的开源协议用于标准化AI应用与外部系统的交互方式。官方的比喻是AI应用的USB-C接口——就像USB-C提供了一种通用的方式连接各种设备MCP提供了一种通用的方式连接各种工具和数据源。关键点MCP不是Claude专属的。它是一个开放协议理论上任何AI应用都可以实现。截至2026年初已经被多个平台采用•AnthropicClaude Desktop、Claude Code•OpenAIChatGPT、Agents SDK、Responses API•GoogleGemini SDK•MicrosoftAzure AI Services•开发工具Zed、Replit、Codeium、Sourcegraph到2026年2月已经有超过1000个开源MCP连接器。2.2 MCP的架构设计MCP基于JSON-RPC 2.0协议采用客户端-主机-服务器Client-Host-Server架构•Host主机用户直接交互的应用Claude Desktop、Cursor、Windsurf•Client客户端Host应用中管理与特定Server通信的组件•Server服务器连接外部系统的桥梁数据库、API、本地文件等这个架构的精妙之处在于Host不需要知道Server的具体实现细节只需要遵循MCP协议即可。2.3 MCP的三个核心原语MCP定义了三种Server可以暴露的原语1. Tools工具——模型控制Tools是可执行的函数AI可以调用来执行操作。关键特征• ✅ 有明确的输入输出schema• ✅ 执行具体操作读、写、更新、删除等• ✅ 由AI自主决定何时调用2. Resources资源——应用控制Resources是数据源为AI提供上下文信息。关键特征• ✅ 提供静态或动态数据• ✅ 不执行操作只提供信息• ✅ 由应用而非AI控制加载时机3. Prompts提示——用户控制Prompts是预定义的提示模板帮助结构化与AI的交互。eview code.py关键特征• ✅ 预定义的工作流程• ✅ 由用户显式触发• ✅ 可以参数化2.4 MCP vs Function Calling很多人会问MCP和OpenAI的Function Calling、Anthropic的Tool Use有什么区别Function Calling是LLM的能力——把自然语言转换成结构化的函数调用请求。LLM本身不执行函数只是告诉你应该调用什么函数参数是什么。MCP是在Function Calling之上的协议层——它标准化了函数在哪里、怎么调用、怎么发现。两者的关系Function Calling解决决定做什么MCP解决怎么做到。2.5 MCP的致命问题上下文爆炸但MCP有一个严重的副作用吃掉你的上下文窗口。每个MCP Server连接到AI时必须把所有工具的定义名称、描述、参数、示例一次性塞进上下文。一个工具的定义大概500-800 tokens一个MCP Server通常有10-20个工具。来看几个真实数据有开发者配了7个MCP Server还没开始对话上下文就被吃掉了67,000 tokens——占AI上下文窗口的33%。更夸张的案例是82,000 tokens占41%。这意味着什么你问AI22等于几它回答4只需要5个token但工具定义已经消耗了15,000 tokens。简单问题的成本被放大了3000倍。更糟糕的是当上下文被工具定义挤占后AI选错工具、传错参数的概率会显著上升。实践中连接2-3个以上的MCP Server工具使用准确性就会明显下降。2.6 MCP的解决方案Tool SearchAnthropic意识到了这个问题。2026年1月Claude Code推出了Tool Search功能• MCP工具不再预加载而是按需发现• 当工具定义超过上下文的10%时自动启用• AI需要用某个工具时先搜索再加载效果立竿见影从77,000 tokens降到8,700 tokens减少85%。但这只是在给MCP打补丁。问题的根源在于MCP的设计假设是把所有工具摆出来让AI挑这在工具数量少的时候没问题工具多了就撑不住。第三部分深度解析Skills——AI的操作手册3.1 Skills是什么Skill全称Agent Skill是Anthropic在2025年10月推出的特性。官方定义“Skills are organized folders of instructions, scripts, and resources that agents can discover and load dynamically to perform better at specific tasks.”翻译一下Skill是一个文件夹里面放着指令、脚本和资源AI会根据需要自动发现和加载。Skill在架构层级上和MCP不同。用Anthropic的话说“Skills are at the prompt/knowledge layer, whereas MCP is at the integration layer.”Skill是提示/知识层MCP是集成层。两者解决不同层面的问题。打个比方•MCP是AI的手能触碰外部世界•Skill是AI的技能书知道怎么做某件事你需要两者配合MCP让AI能连接数据库Skill教AI怎么分析查询结果。3.2 Skills的核心设计渐进式披露Skill最精妙的设计是渐进式披露Progressive Disclosure。这是Anthropic在上下文工程Context Engineering领域的重要实践。官方的比喻“Like a well-organized manual that starts with a table of contents, then specific chapters, and finally a detailed appendix.”就像一本组织良好的手册先看目录再翻到相关章节最后查阅附录。Skill分三层加载第1层元数据始终加载• Skill名称 描述• 约100 tokens• 就像浏览书架上的书名和简介不打开书第2层核心指令按需加载• SKILL.md完整内容• 通常5k tokens• 当AI判断某个Skill与任务相关时才读取第3层参考资料深度按需加载• reference.md、脚本、模板等• 理论上可以包含无限内容• 只有任务真正需要时才加载这个设计的好处是什么传统方式比如MCP在会话开始时就把所有信息加载到上下文。如果你有10个MCP Server每个暴露5个工具那就是50个工具定义——可能消耗数千甚至上万Token。Skill的渐进式加载让你可以有几十个Skill但同时只加载一两个。上下文效率大幅提升。用官方的话说“This means that the amount of context that can be bundled into a skill is effectively unbounded.”理论上单个Skill可以包含无限量的知识——因为只有需要的部分才会被加载。3.3 Skills的文件结构一个标准的Skill长这样SKILL.md是核心必须包含YAML格式的元数据---name:code-reviewdescription: Review code for bugs, security issues, and style violations. Use when asked to review code, check for bugs, or audit PRs.---# Code Review Skill## InstructionsWhenreviewingcode,follow these steps:1.Firstcheckforsecurityvulnerabilities...2.Thencheckforperformanceissues...3.Finallycheckforcodestyle...## ExamplesExample 1:Input: def foo(x):returnx1Output:Missingtypehints,consideraddingtype annotations.关键字段•nameSkill的唯一标识小写字母数字连字符最多64字符•description描述做什么、什么时候用最多1024字符description的质量直接决定Skill能不能被正确触发。3.4 Skills的触发机制Skill是自动触发的这是它和Slash Command的关键区别。工作流程扫描阶段Claude读取所有Skill的元数据名称描述匹配阶段将用户请求与Skill描述进行语义匹配加载阶段如果匹配成功加载完整的SKILL.md执行阶段按照Skill里的指令执行任务按需加载支持文件用户不需要显式调用。比如你有一个code-reviewSkill用户说帮我review这段代码Claude会自动匹配并加载。Skill的本质是什么技术上Skill是一个元工具Meta-toolSkill不是执行具体动作而是注入指令到对话历史中动态修改Claude的执行环境。3.5 Skills的杀手锏自带脚本Skills还有一个很多人忽略的能力它可以自带可执行脚本。一个典型的Skill文件夹结构是这样的关键来了当AI运行scripts/validate.py时脚本代码本身不会加载到上下文只有执行结果会返回。这是什么概念假设你有一个500行的Python脚本用来处理PDF表单。用传统方式AI要么自己写代码消耗大量tokens生成要么读取你的脚本再执行脚本内容占用上下文。而用SkillsAI直接运行预写好的脚本整个过程可能只消耗50 tokens的输出结果。脚本执行 零上下文成本 确定性结果更重要的是这些脚本通过Agent内置的bash工具执行不需要MCP。Skills支持的脚本语言包括Python、Bash、JavaScript等基本上你系统能跑的都能用。这意味着• ✅ 文件读写Skill脚本搞定• ✅ 数据处理Skill脚本搞定• ✅ 格式转换Skill脚本搞定• ✅ 本地API调用Skill脚本搞定3.6 写好Skill的关键description的质量Skill能不能被正确触发90%取决于description写得好不好。❌ 差的descriptiondescription: Helps with data太宽泛Claude不知道什么时候该用。✅ 好的descriptiondescription: Analyze Excel spreadsheets, generate pivot tables, and create charts. Use when working with Excel files (.xlsx), spreadsheets, or tabular data analysis. Triggers on: analyze spreadsheet, create pivot table, Excel chart好的description应该包含做什么具体的能力描述什么时候用明确的触发场景触发词用户可能说的关键词第四部分MCP vs Skills——终极对比4.1 架构层级对比现在我们可以从架构层级来理解两者的区别Skill在上层知识层MCP在下层集成层。两者不是替代关系而是互补关系。你可以• 用MCP连接GitHub• 用Skill教AI如何按照团队规范做Code Review4.2 详细对比表维度MCPSkills核心作用连接外部系统编码专业知识和方法论架构层级集成层底层知识层上层类比USB协议应用程序问的问题“AI能访问什么”“AI知道怎么做什么”协议基础JSON-RPC 2.0Markdown文件跨平台✅ 是开放协议❌ 否Anthropic专属触发方式持久连接随时可用语义匹配自动触发Token消耗❌ 高工具定义始终占用✅ 低渐进式加载能访问外部系统✅ 可以❌ 不能需配合MCP或内置工具实现复杂度高需要运行Server低写Markdown就行适用场景查数据库、调API代码审查、文档生成分发方式URL接入面向外部用户文件复制面向内部团队可执行性API调用脚本执行安全性外部内容带来prompt injection风险Skill文件本身可能包含恶意指令4.3 什么时候用MCP什么时候用Skills✅ 用MCP的场景需要访问外部数据数据库查询、API调用、文件系统访问需要操作外部系统创建GitHub Issue、发送Slack消息、执行SQL需要实时信息监控系统状态、查看日志、搜索引擎结果需要跨平台复用同一个工具在Claude Desktop、Cursor、其他支持MCP的应用中使用对外提供服务做一个服务让外部用户都能用✅ 用Skills的场景重复性的工作流程代码审查、文档生成、数据分析公司内部规范代码风格、提交规范、文档格式需要多步骤的复杂任务需要详细指导的专业任务团队共享的最佳实践标准化的操作流程Token敏感场景需要大量知识但不想一直占用上下文优化自己或团队的工作流本地自动化4.4 组合使用最佳实践很多时候两者是配合使用的MCP负责能访问什么Skill负责怎么做。第五部分真实案例——从MCP到Skills的演进5.1 案例自动发布X Article这是一个真实发生的演进过程完美展示了从MCP到Skills的转变。需求把Markdown文章自动发布到XTwitter的长文功能X Article。方案一Playwright MCP王树义老师开发了x-article-publisher-skill流程是这样的提示词很简洁功能也很强大。但问题来了上下文消耗得飞快。Playwright MCP有22个工具光工具定义就占用约8,000-10,000 tokens。更要命的是每次浏览器交互MCP都要返回页面的accessibility tree无障碍树快照——这是为了让AI理解当前页面状态。一个复杂页面的快照可能就是几千tokens。发布一篇文章可能需要打开页面、等待加载、点击编辑器、粘贴内容、上传图片、调整位置、保存草稿……每一步都是一次MCP交互每一次交互都在消耗上下文。结果一篇文章发完上下文可能已经用掉50,000 tokens。方案二Skills CDP脚本改进版本baoyu-post-to-x把Playwright MCP部分完全改成了脚本核心变化脚本直接调用Chrome CDPChrome DevTools Protocol绕过MCP传入Markdown文件路径脚本自己解析内容脚本自己完成所有浏览器操作打开页面、填充内容、上传图片、保存草稿只返回最终结果给Agent“发布成功草稿链接xxx”整个过程AI只需要做一件事调用脚本传入文件路径。上下文消耗可能只有几百tokens。对比分析Playwright MCPSkills CDP脚本工具定义~10,000 tokens22个工具0脚本不需要工具定义每次交互返回页面快照数千tokens无中间交互AI参与度每一步都要AI决策只需调用一次脚本总消耗50,000 tokens几百tokens关键洞察MCP的设计是让AI一步步操作每一步都要理解、决策、执行。而脚本的设计是把整个流程封装起来AI只需要说开始和结束。这就是为什么即使MCP支持了Tool Search按需加载工具上下文问题也没有根本解决——因为工具定义只是一部分真正的大头是交互过程中产生的中间结果。而Skills的脚本执行模式天然避开了这个问题脚本代码不进入上下文中间过程不进入上下文只有最终结果进入上下文。第六部分Tools的定位——MCP的能力单元6.1 Tools是什么在前面的讨论中我们一直在说MCP和Skills那么Tools到底扮演什么角色Tools是MCP暴露的具体能力单元。回想一下MCP的三个核心原语Tools工具可执行的函数Resources资源数据源Prompts提示预定义的提示模板Tools是其中最常用、最核心的部分。6.2 Tools vs MCP的关系可以把MCP理解为一个协议框架而Tools是这个框架中具体的能力实现。类比•MCP HTTP协议•Tools RESTful API端点HTTP定义了请求响应的标准而具体的API端点如GET /users、POST /articles才是实际的能力。一个MCP Server通常会暴露多个Tools每个Tool都有• 名称name• 描述description• 参数schemaparameters6.3 Tools vs Skills的区别虽然Tools和Skills都能扩展AI能力但它们的本质完全不同Tools工具• ✅ 是执行单元执行具体操作• ✅ 有明确的输入输出schema• ✅确定性执行同样的输入得到同样的输出• ✅ 由AI自主决定何时调用• ✅ 通常是API调用或函数执行Skills技能• ✅ 是知识单元提供方法论和指导• ✅ 用自然语言描述• ✅非确定性AI需要理解并执行指令• ✅自动触发基于语义匹配• ✅ 通常是工作流程或最佳实践打个比方厨具是执行工具菜谱是操作指南。两者配合才能做出一道好菜。第七部分未来趋势与最佳实践7.1 随着Skills普及MCP的需求会大幅减少这是一个正在发生的趋势。想想看什么时候你真正需要MCP需要MCP的场景不需要MCP的场景事实上Anthropic的工程博客提到他们用代码执行MCP的方法把一个150,000 token的工作流压缩到了2,000 tokens——核心思路就是让AI写代码调用工具而不是预加载所有工具定义。这正是Skills的设计方向用脚本封装能力用渐进式披露管理知识最大限度减少上下文消耗。未来的格局可能是这样的少数通用MCP Server处理远程连接数据库、云API、SaaS集成大量Skills编码专业知识和本地工作流两者在必要时协作但Skills会承担绝大部分教AI怎么做事的工作7.2 给开发者和架构师的建议对于个人开发者优先学习Skills它更轻量、更高效、更容易上手用Skills封装你的工作流程把重复性任务自动化只在必须连接远程系统时才用MCP避免不必要的上下文消耗复杂逻辑用脚本不要让AI一步步操作对于团队/企业建立Skills库将团队的最佳实践、代码规范、工作流程打包成Skills用Git管理Skills版本控制、代码审查、持续集成MCP用于对外服务如果要给客户提供AI服务用MCP标准化接口两者结合使用MCP连接外部系统Skills编码内部流程对于架构师理解架构层级MCP在集成层Skills在知识层设计混合架构MCP Skills 内置工具关注Token效率渐进式披露优于预加载考虑安全性审查MCP Server和Skills的来源7.3 三个关键问题帮你做决策到底选MCP还是Skills问自己三个问题1. 谁来用2. 怎么分发3. 要解决什么问题结尾回到最初的问题所以回到文章开头那位开发者的问题“MCP、Tools、Skills到底有什么区别”现在我们可以给出清晰的答案一句话总结•MCP是AI世界的USB协议定义了AI与外部世界的连接标准•Tools是MCP暴露的具体能力是AI可以调用的函数•Skills是AI的操作手册教AI怎么完成特定任务它们的关系•MCP vs Skills不是竞争关系而是不同层次的能力集成层 vs 知识层•MCP vs Tools框架 vs 实现MCP是协议Tools是协议中的能力单元•Tools vs Skills执行工具 vs 操作指南一个是能做什么一个是怎么做最佳实践用Skills编码你的领域知识用MCP连接外部服务。比如你们公司有一套特定的工作流程先查这个系统再查那个系统按某个顺序处理。这种领域知识用Skills写出来让AI理解。但具体连接那些系统的能力靠MCP提供。两层配合各司其职。最后的建议如果你只能选一个先学选Skills。它更轻量、更高效、更容易上手能解决你日常遇到的大部分问题。但如果你想构建企业级AI系统两者都要掌握。因为一个成熟的AI Agent系统两者都需要。普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事02适学人群应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】