AI大模型常见核心术语速懂LLM/Token/RAG/Agent/MC等

AI大模型常见核心术语速懂LLM/Token/RAG/Agent/MC等 AI 基础学习大模型常用专业名词通俗汇总AI 基础学习大模型常用专业名词通俗汇总LLM/Token/RAG/Agent/MC等二、通俗举例讲述 AI发展四段历程一、AI 发展的四次关键阶段1\. 符号 AI1956\-70 年代规则驱动的 “程序机器”2\. 传统机器学习 ML90 年代 \- 2010数据驱动的 “单任务专家”3\. 深度学习 DL2012\-2020特征自提取的 “专项能手”4\. LLM 大语言模型2020 至今通用智能的 “全能助手”总结三、LLM 核心基础概念1. LLM 大语言模型2. Transformer大模型的“底层基石”3. Token Tokenizer Token IDAI的“翻译官”三、大模型四大扩展技术1\. RAG检索增强生成AI的“外挂知识库”2\. Tool工具AI的“手脚和眼睛”3\. MCP模型上下文协议AI界的“万能USB\-C接口”4\. Agent智能体\SkillAI的“自主办事系统”四、Agent 和 Tool、MCP 的关系重点五、主流 AI 产品分类落地对照六、总结AI 基础学习大模型常用专业名词通俗汇总LLM/Token/RAG/Agent/MC等一、前言当下豆包、ChatGPT、Kimi 等 AI 工具普及但绝大多数使用者看不懂 LLM、Token、RAG、Agent 等行业术语。本文从零梳理大模型全链路基础概念结合市面主流产品举例零基础也能快速吃透 AI 底层名词。二、通俗举例讲述 AI发展四段历程符号AI→传统机器学习ML→深度学习DL→如今LLM大模型时代2017年谷歌Transformer架构出世才催生现在全品类AI产品。一、AI 发展的四次关键阶段AI 的发展不是一蹴而就的经历了四次标志性的技术变革也正是这些阶段的演进才催生了如今我们熟悉的通用大模型。1. 符号 AI1956-70 年代规则驱动的 “程序机器”核心逻辑人工编写固定规则依靠if-else逻辑运行本质是 “条件匹配”。局限性只能处理预设场景没写进规则的情况就无法应答通用性极差。可以处理短内容但仅局限于预设短句、简单条件。通俗举例程序员提前写死规则如果下雨 → 带雨伞如果暴晒 → 带遮阳伞如果多云 → 不带伞当用户问 “阴天要不要带伞” 时因为没有预设规则系统直接无法回答。2. 传统机器学习 ML90 年代 - 2010数据驱动的 “单任务专家”核心逻辑从数据中自动提取规律需要人工筛选特征模型仅能适配单一场景。局限性换场景或新增变量时需要重新选特征、重新训练模型无法直接复用。处理短内容表现优秀但不擅长拓展新判断维度。通俗举例收集大量 “气温 - 穿衣” 数据人工选定「温度」作为唯一特征训练出一个穿搭模型它能根据气温判断该穿短袖还是长袖甚至能推算出 12℃这种没写过的温度该穿什么但如果想让模型结合 “风力” 判断要不要加外套就必须人工新增「风力」特征重新采集数据重头训练旧模型无法直接复用。3. 深度学习 DL2012-2020特征自提取的 “专项能手”核心逻辑依靠神经网络自主提取特征无需人工筛选但模型是 “任务割裂” 的只能专精单一领域。局限性不同任务的模型无法通用无法跨领域理解和处理问题。能正常识别图片、数值类短内容但看不懂简短的自然语言提问。通俗举例用海量天气照片训练一个图像识别模型它能通过图片自动判断 “晴天 / 雨天” 并推荐穿搭但你打字问它 “秋天适合穿什么面料的衣服”这个纯文字问题它完全看不懂无法回答。4. LLM 大语言模型2020 至今通用智能的 “全能助手”核心逻辑依托 Transformer 架构用海量文本数据训练实现通用智能能同时处理文字、逻辑、创作、编程等多种任务。短内容、长篇文档、多轮长对话都能轻松应对。通俗举例以豆包为例无需单独训练也不用预设规则问 “12℃穿什么衣服”它能结合气温、季节给出穿搭建议问 “秋天穿搭有什么讲究”它能科普面料选择、搭配技巧一个模型就能搞定所有问题这就是通用大模型的魅力。总结符号没编写的场景→不会ML同类场景能推算新增变量要重训DL自动挖掘多维度规律但只能处理图 / 数字不懂自然对话LLM全场景文字问题通用三、LLM 核心基础概念1. LLM 大语言模型全称Large Language Model大语言模型本质一个超大的神经网络函数核心任务永远是「预测下一个词」。通俗理解它不是“真正理解”文字而是根据海量数据学到的语言规律像“文字接龙”一样一步步生成通顺的回答。AI没有提前写好的标准答案也不会像人类一样先思考完整句子再输出。你疑惑的点一句话后面明明能接很多字为什么AI不会乱原理很简单AI学过全网海量文字知道人类的说话习惯每一步都会优先选最通顺、最符合语境、概率最高的字淘汰所有别扭、不通顺的字。且每生成一个字就结合整段内容重新判断下一个字一步步拼接出完整正确的回答。落地举例豆包字节自研Seed大模型ChatGPTOpenAI的旗舰闭源大模型ClaudeAnthropic主打超长文本的大模型DeepSeek国产开源大模型支持本地部署。通俗举例我们日常使用的豆包、ChatGPT、Claude本质都是不同厂商训练的LLM大模型所有AI回答、创作、问答功能都基于LLM的“预测下一词”逻辑实现。输入“今天天气很”后续能接好、冷、热、闷等很多字AI不会瞎选。结合日常用语概率最优解是“好”句子变成“今天天气很好”再基于完整句子继续接龙依次匹配“适”“宜”“出”“门”最终拼成通顺完整的回答。全程逐字迭代、贴合语境所以AI回答通顺、合理、不混乱。训练三阶段预训练学习全网通用知识→ SFT监督微调学会人类对话方式→ RLHF人类强化学习优化回答、修正错误、规避幻觉。2. Transformer大模型的“底层基石”Transformer 是谷歌 2017 年提出的神经网络架构出自经典论文《Attention Is All You Need》目前所有主流 LLM 都基于该架构开发。它搭载自注意力机制可以精准识别长篇文章、万字对话等长内容解决了老式模型读取长文本容易遗忘前文的问题同时支持并行运算大幅提升模型训练速度是现代大模型的核心基础。通俗举例老式AI读长文章越看越忘答非所问基于Transformer的豆包、GPT可以完整读完几万字论文记住全文细节并精准总结、答疑。3. Token Tokenizer Token IDAI的“翻译官”Tokenizer分词器AI的“翻译官”负责把人类文字↔机器能理解的数字双向转换。Token词元AI处理文本的最小单位1个Token≈1.5个汉字/0.75个英文单词和词语不是一一对应的。Token ID每个Token对应的数字编号是模型唯一能识别的数据。通俗举例你在豆包输入“工作坊”Tokenizer会把它拆成两个Token英文单词“helpful”会被拆成“help”和“ful”两个Token再映射成数字送入模型运算。Context Context WindowAI的“临时记忆”Context上下文AI的临时记忆池整合了系统指令、历史对话、当前提问所有内容都以Token形式存储。Context Window上下文窗口AI记忆的最大上限即模型单次能够容纳、识别的最大Token数量。核心价值窗口越大AI能记住的内容越多能处理的文档、对话越长。通俗举例你先跟豆包说“我叫小张”后续提问“我叫什么名字”AI能准确回答就是依靠Context记忆豆包Pro、Kimi、Claude超大窗口可以一次性读完几十万字PDF全文并解答问题。Prompt提示词AI的“指令钥匙”User Prompt用户提示词用户手动输入的问题和指令是触发AI任务的直接请求。System Prompt系统提示词后台隐藏的固定配置用来设定AI人设、回答风格、输出规则用户无法修改。核心价值Prompt决定AI“做什么、怎么做、输出什么风格”是人机交互的核心入口。通俗举例你在输入框输入“写一篇秋天的散文”这是User Prompt豆包后台预设“回答简洁、通俗、贴合中文语境”这是System Prompt决定了最终的回答效果。三、大模型四大扩展技术1. RAG检索增强生成AI的“外挂知识库”核心定义一种外挂增强技术为大模型搭配外部知识库通过检索真实资料辅助模型生成答案。解决痛点完美解决大模型知识过时、内容幻觉编造错误信息、上下文窗口不足三大问题。核心价值不用重新训练模型就能让AI掌握最新、专属、私有知识大幅提升答案准确率。通俗举例企业上传最新产品手册、学校上传课件、个人上传文档AI提问时优先检索文档内容作答Kimi、WPS AI、豆包知识库的长文档问答全部基于RAG实现。2. Tool工具AI的“手脚和眼睛”核心定义可被大模型自主调用的外部函数接口是AI延伸自身能力的外置工具。解决痛点原生大模型仅依靠训练数据无法获取实时信息、也不能执行实体操作。原生大模型知识固定、无法联网、无法处理外部事务工具可以补齐实时能力、实操能力。相当于给 AI 装上眼睛去查看外部信息、装上手脚去完成各类操作按需调用不同工具拓展能力边界常见工具天气查询、联网搜索、计算器、代码运行、地图定位、文件解析等。通俗举例大模型记不住当下的天气、最新新闻也不会手动计算、查询地图。当你询问实时天气AI 会调用天气工具获取数据提出计算需求就启用计算器工具想要查找路线则调用地图工具最终把结果整理成文字回复你。3. MCP模型上下文协议AI界的“万能USB-C接口”核心定义统一的AI工具接入标准是大模型和外部工具、数据之间的通用连接协议。解决痛点解决不同AI平台接口不通用、工具需要重复开发、适配成本高的问题。核心价值一套工具只需开发一次即可兼容豆包、ChatGPT、Claude等所有主流大模型。通俗举例就像USB-C接口适配所有手机一样基于MCP开发的天气、查询、办公工具不用修改代码就能在各大AI平台直接使用。TOOL和MCP关系总结直接记这句Tool 是 “能做什么”MCP 是 “怎么标准化地连接和调用”没有 ToolMCP 没东西可接没有 MCPTool 难统一管理和复用4. Agent智能体SkillAI的“自主办事系统”Agent智能体Agent 能自己思考、自己规划、自己调用工具完成复杂任务的 AI。核心大模型脑子 记忆 规划 工具调用手脚 和普通聊天机器人最大区别 普通 LLM你问一句 →它答一句被动、短视、记不住上下文 Agent你给一个目标它会 理解需求 自己拆成多步小任务 自己选要用什么 Tool 调用工具执行拿到结果再思考、调整、继续做 直到把整件事做完一句话类比普通 LLM 只会答话的文员Agent 会自己排计划、会用工具、能独立干活的项目经理Skill技能给Agent的标准化任务说明书提前固化业务流程、执行规则、失败处理方案。核心价值让AI从“被动回答”升级为“主动做事”实现全自动任务执行。通俗举例你对 Agent 说“帮我查一下今天唐山天气再算一下从现在到下班还有多少小时最后写一句提醒我带伞的话。”Agent 会自己做这三件事不用你一步步指挥理解要天气 计算时长 写提醒规划顺序先查天气 → 再算时间 → 最后写句子调用 Tool调用天气 Tool拿到 “今天有雨25℃”调用计算器 Tool算出 “还有 4.5 小时下班”自己组合结果输出今天唐山有雨气温 25℃距离下班还有 4.5 小时请记得带伞。全程自主闭环感知→思考→行动→反馈→再思考。四、Agent 和 Tool、MCP 的关系重点1Tool工具是具体干活的 “手脚”天气、计算器、数据库、文件读写、联网搜索…只会做单一动作没有脑子不会自己规划2MCPModel Context Protocol是统一插座 / 通用接口标准让所有 Tool 能用同一套规则接入 Agent不用每个工具单独适配3Agent智能体是总指挥 / 大脑决定什么时候用 Tool决定用哪个 Tool决定怎么组合多个 Tool处理 Tool 返回的结果继续决策关系一句话串起来Agent 大脑 指挥中心Tool 各种工具电钻、锤子MCP 统一电源接口没有 ToolAgent 干不了活没有 MCPTool 很难统一接入没有 AgentTool 只是一堆孤立功能没人指挥。总结大模型文字接龙、回答问题只有嘴没手脚外挂知识库额外记忆 / 资料Tool 工具手脚眼睛查天气、算题、调接口MCP所有 Tool 的统一接入标准Agent 智能体大模型 记忆 规划 Tool/MCP 的总和能自主完成复杂任务五、主流 AI 产品分类落地对照产品类型代表工具核心用途通用对话类豆包、ChatGPT、Claude、Gemini日常聊天、知识问答、文案创作、通用推理文档办公类Kimi、WPS AI、豆包办公版长文档总结、方案撰写、表格处理、PDF解析编程工具类Cursor、Copilot、豆包编程助手代码生成、BUG调试、项目开发、脚本编写Agent 自主任务类AutoGPT、Devin复杂任务拆解、全自动执行、自动化办公多模态 AIGPT-4o、豆包 Seed2.0、Sora识图理解、语音对话、AI绘画、视频生成六、总结本文从AI四次发展浪潮入手通俗拆解了LLM、Transformer、Token、Context、Prompt等核心基础名词同时讲解了RAG、Tool、MCP、Agent四大落地扩展技术。从底层技术原理到上层产品应用完整覆盖了新手必备的AI基础知识点。吃透这些概念就能看懂绝大多数AI产品的底层逻辑高效用好各类AI工具。