本文深入浅出地介绍了智能体Agent的概念及其内部构造重点解析了多智能体Multi-Agent的七种设计模式包括工作流、路由、并行、循环、聚合、网络和层级模式并详细阐述了每种模式的适用场景。此外文章还探讨了多种成熟的智能体框架如AutoGPT、Dify、AutoGen等并分析了Agent框架在解决复杂问题、动态决策和跨系统推理方面的优势为初学者提供了全面而实用的智能体学习指南。很多伙伴对智能体Agent的范式不熟悉还不理解ReAct、Planner、反思叭叭这些名词。那你们就来对了地方我用最容易理解的方式带大家一起看下智能体内部是什么样子的。产品化的智能体由多Agent反思计划推理与行动记忆RAG工具MCP组成的。首先聊下“Multi-Agent”它非常好玩Multi-Agent 的7种设计模式要让 AI 代替人工作现阶段的单体智能体仅通过系统提示词赋能的LLM是很难实现的。我们很快意识到要构建高效的系统需要多个专业化智能体协同工作、自主组织。为实现这一目标AI 智能体领域已涌现出多种架构模式。多个智能体组成实现的也就是Multi-Agent发展到现在有7种实现方式。1、工作流模式在《Agentic Design Patterns》中叫Prompt Chaining每个智能体都逐步地完成输出比如一个生成代码另一个审核代码第三个部署代码。每一步的输出作为下一步的输入。这种信息传递建立了依赖链前序操作的上下文和结果会引导后续处理使 LLM 能够在前一步基础上不断完善理解逐步逼近目标解。他非常适合应用在工作流自动化、ETL和多步骤推理pipeline场景。2、路由模式路由模式为智能体的操作框架引入了条件逻辑使其从固定执行路径转变为动态评估标准从一组可能的后续动作中进行选择的模式从而实现一套更灵活并且具备上下文感知的。一个控制器智能体将任务分配给合适的专业智能体这是上下文感知智能体路由的基础正如在MCP、A2A框架中所看到的那样。路由模式的实现有四种根据LLM路由通过提示语言模型分析输入并输出指示下一步或目标的标识符或指令。这里有显式路由和隐式路由两类显示直接使用智能体的结构化输出来确定将消息路由到哪个智能体。隐式路由是将下游智能体包装成工具函数这样路由智能体就可以根据用户查询决定调用哪个工具。根据 Embedding 路由利用嵌入能力将查询路由到最相似的路径上适用于语义路由即决策基于输入的含义而非关键词。 伪代码示例 def __init__(self): # 使用轻量级的句子编码模型 self.model ChatModel( model_namegpt-4, api_key, streamFalse, ) # 定义不同的路由能力和对应的处理函数 self.routes { code_help: { description: 编程代码, handler: self.handle_code_question }, general_chat: { description: 聊天日常对话, handler: self.handle_general_chat } } # 预计算所有路由描述的嵌入向量 self.route_embeddings {} for route_name, route_info in self.routes.items(): embedding self.model.encode([route_info[description]]) self.route_embeddings[route_name] embedding def route_query(self, user_question): # 1. 将用户问题转换为嵌入向量 question_embedding self.model.encode([user_question]) # 2. 使用余弦计算与各个路由的相似度 similarities {} for route_name, route_embedding in self.route_embeddings.items(): similarity cosine_similarity(question_embedding, route_embedding)[0][0] similarities[route_name] similarity # 3. 选择相似度最高的路由 best_route max(similarities, keysimilarities.get) best_score similarities[best_route] # 4. 调用对应的处理器 handler self.routes[best_route][handler] response handler(user_question) return { route: best_route, confidence: best_score, response: response } ....根据定义规则路由硬编码方式根据关键词、模式或结构化数据进行路由。此方法比 LLM 路由更快、更确定但灵活性较低。根据自训小模型路由采用如分类器等判别模型在小规模标注数据集上专门训练以实现路由任务。与向量嵌入方法类似但其特点是监督微调过程路由逻辑编码在模型权重中。与 LLM 路由不同决策组件不是推理时执行提示的生成模型而是已微调的判别模型。LLM 可用于生成合成训练数据但不参与实时路由决策。3. 并行模式每个智能体负责处理不同的子任务例如数据爬虫、网络检索和摘要生成它们的输出会合并为一个单一结果。非常适合减少高吞吐量管道中的延迟。如文档解析或API编排4. 循环模式智能体不断优化自身输出直到达到预期质量。非常适合校对、报告生成或创意迭代在这些场景中系统会在确定最终结果前再次思考。反思就是在此模式上进行的优化。5. 聚合模式许多智能体生成部分结果由主智能体将这些结果整合为一个最终输出。因此每个智能体都形成一个观点而一个Master智能体将这些观点汇总成共识。在RAG的检索融合、投票系统等场景中很常见。6、网络模式这里没有明确的层级结构智能体之间可以自由交流动态共享上下文。用于模拟、多智能体游戏以及需要自由形式行为的集体推理系统中。agentscope-samples 模拟了9个智能体的狼人杀游戏。7、层级模式一个顶级规划智能体将子任务分配给工作智能体跟踪它们的进度并做出最终决策。这和经理及其团队的工作方式完全一样很多中间件的架构也是类似这种模式如Redis、ES、Nocas。意图识别就是采用此模式。小节我们一直在思考的一件事不是哪种模式看起来最酷而是哪种模式能最大限度地减少智能体之间的摩擦。启动10个智能体并称之为一个团队很容易。难的是设计沟通流程以确保没有两个智能体会做重复工作。每个智能体都知道何时行动何时等待使这个系统作为一个整体比其任何单个部分都更智能。为此我们遵循 building-effective-agents 设计。三、Multi-Agent 框架多智能体模式将人工智能工作流构建为一个智能体团队它们相互协作每个智能体都有明确的角色。每个智能体能够感知输入、进行推理通过思维链并执行操作以完成子任务。每个智能体通常都配置有特定角色并且只能访问该角色所需的工具或信息。例如PM AGent负责需求判断是否需要其他智能体参与若需要技术决策则联动Tech lead agent。智能体将循环进行思考“思考……”和行动“行动……”直到完成其工作部分的任务。如下图以上简单介绍了多智能体的设计模式那么当下是不是已经有了成熟的架构供我们使用呢答案是肯定的AutoGPTGithub 180k StarDify Github 118k StarAutoGen Github 51.4k StarCrewAIGithub 40.1k StarLangGraph Github 20.6k Star为什么需要使用Agent框架只要“问题不可完全穷举、要跨多系统查证、并且需要在对话中澄清、协商、决策”就更应该用 Agent 框架而不是纯 Workflow。纯 Workflow 的“天花板”Workflow 在对话中的“澄清—再决策—再行动” 并不天然友好需要把每一步提问、回答、重试都画成节点复杂而脆弱。场景用户发起“我的包裹还没到怎么办”通过Workflow创建如下智能体(先不期待GPT-6 会自主思考的智能体)意图识别智能体识别用户诉求查询进度/催促/投诉/报损/退货等物流状态智能体实时拉取承运商状态判断包裹位置、异常政策规则智能体查询当前时段政策节假日、大促、平日判断是否特殊处理用户画像智能体判断用户等级、历史行为、是否会员异常检测智能体分析是否有报损、拒收、欺诈等信号澄清与补充智能体信息不全时自动向用户提问补齐决策所需信息解决方案生成智能体综合所有智能体结果输出最优处理方案比如建议等待/补发/赔偿/升级处理/转人工等智能体数量✖️物流状态✖️用户等级✖️物流政策….你的分支会爆炸。所以需要用Dify这类的可以支持动态决策动态推理和澄清的智能体框架。Agent 框架解决的核心问题以 AutoGen、CrewAI 这类 Agent 框架为例它们把“在对话里动态规划与调用工具”作为第一性能力场景用户说“我10.1买的手机现在还没到给我退货另外你们的运费险的保账期是多久”一个合格的客服 Agent 团队会做什么没有路由决策首先会动态匹配所有Query对Query进行改写成“查询用户的订单”“用户想要退货”“运费险的保账范围和条款”。1.意图识别 澄清Planner Agent拆出多意图物流异常、退货、计费异常、运费险条款先问关键订单号、地址。2.跨系统取证OMS/物流工具查轨迹与 SLA计费/支付工具核对重复扣款交易CRM看是否 Plus、是否有历史补偿记录保库查询运费险3.政策推理与合规Policy Agent套用“假期延误 Plus 运费险”的组合条款评估可给的补偿区间、是否触发风控人工复核。这些动作里很多步骤无法事先“画”成固定分支需要在对话上下文里做决策、需要跨工具动态组合、需要“问一句 → 查一下 → 再决定”这正是 Agent 的强项。结尾以上是对多智能体的总结你会了吗最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
小白也能懂!收藏这7种Multi-Agent设计模式,轻松入门智能体开发
本文深入浅出地介绍了智能体Agent的概念及其内部构造重点解析了多智能体Multi-Agent的七种设计模式包括工作流、路由、并行、循环、聚合、网络和层级模式并详细阐述了每种模式的适用场景。此外文章还探讨了多种成熟的智能体框架如AutoGPT、Dify、AutoGen等并分析了Agent框架在解决复杂问题、动态决策和跨系统推理方面的优势为初学者提供了全面而实用的智能体学习指南。很多伙伴对智能体Agent的范式不熟悉还不理解ReAct、Planner、反思叭叭这些名词。那你们就来对了地方我用最容易理解的方式带大家一起看下智能体内部是什么样子的。产品化的智能体由多Agent反思计划推理与行动记忆RAG工具MCP组成的。首先聊下“Multi-Agent”它非常好玩Multi-Agent 的7种设计模式要让 AI 代替人工作现阶段的单体智能体仅通过系统提示词赋能的LLM是很难实现的。我们很快意识到要构建高效的系统需要多个专业化智能体协同工作、自主组织。为实现这一目标AI 智能体领域已涌现出多种架构模式。多个智能体组成实现的也就是Multi-Agent发展到现在有7种实现方式。1、工作流模式在《Agentic Design Patterns》中叫Prompt Chaining每个智能体都逐步地完成输出比如一个生成代码另一个审核代码第三个部署代码。每一步的输出作为下一步的输入。这种信息传递建立了依赖链前序操作的上下文和结果会引导后续处理使 LLM 能够在前一步基础上不断完善理解逐步逼近目标解。他非常适合应用在工作流自动化、ETL和多步骤推理pipeline场景。2、路由模式路由模式为智能体的操作框架引入了条件逻辑使其从固定执行路径转变为动态评估标准从一组可能的后续动作中进行选择的模式从而实现一套更灵活并且具备上下文感知的。一个控制器智能体将任务分配给合适的专业智能体这是上下文感知智能体路由的基础正如在MCP、A2A框架中所看到的那样。路由模式的实现有四种根据LLM路由通过提示语言模型分析输入并输出指示下一步或目标的标识符或指令。这里有显式路由和隐式路由两类显示直接使用智能体的结构化输出来确定将消息路由到哪个智能体。隐式路由是将下游智能体包装成工具函数这样路由智能体就可以根据用户查询决定调用哪个工具。根据 Embedding 路由利用嵌入能力将查询路由到最相似的路径上适用于语义路由即决策基于输入的含义而非关键词。 伪代码示例 def __init__(self): # 使用轻量级的句子编码模型 self.model ChatModel( model_namegpt-4, api_key, streamFalse, ) # 定义不同的路由能力和对应的处理函数 self.routes { code_help: { description: 编程代码, handler: self.handle_code_question }, general_chat: { description: 聊天日常对话, handler: self.handle_general_chat } } # 预计算所有路由描述的嵌入向量 self.route_embeddings {} for route_name, route_info in self.routes.items(): embedding self.model.encode([route_info[description]]) self.route_embeddings[route_name] embedding def route_query(self, user_question): # 1. 将用户问题转换为嵌入向量 question_embedding self.model.encode([user_question]) # 2. 使用余弦计算与各个路由的相似度 similarities {} for route_name, route_embedding in self.route_embeddings.items(): similarity cosine_similarity(question_embedding, route_embedding)[0][0] similarities[route_name] similarity # 3. 选择相似度最高的路由 best_route max(similarities, keysimilarities.get) best_score similarities[best_route] # 4. 调用对应的处理器 handler self.routes[best_route][handler] response handler(user_question) return { route: best_route, confidence: best_score, response: response } ....根据定义规则路由硬编码方式根据关键词、模式或结构化数据进行路由。此方法比 LLM 路由更快、更确定但灵活性较低。根据自训小模型路由采用如分类器等判别模型在小规模标注数据集上专门训练以实现路由任务。与向量嵌入方法类似但其特点是监督微调过程路由逻辑编码在模型权重中。与 LLM 路由不同决策组件不是推理时执行提示的生成模型而是已微调的判别模型。LLM 可用于生成合成训练数据但不参与实时路由决策。3. 并行模式每个智能体负责处理不同的子任务例如数据爬虫、网络检索和摘要生成它们的输出会合并为一个单一结果。非常适合减少高吞吐量管道中的延迟。如文档解析或API编排4. 循环模式智能体不断优化自身输出直到达到预期质量。非常适合校对、报告生成或创意迭代在这些场景中系统会在确定最终结果前再次思考。反思就是在此模式上进行的优化。5. 聚合模式许多智能体生成部分结果由主智能体将这些结果整合为一个最终输出。因此每个智能体都形成一个观点而一个Master智能体将这些观点汇总成共识。在RAG的检索融合、投票系统等场景中很常见。6、网络模式这里没有明确的层级结构智能体之间可以自由交流动态共享上下文。用于模拟、多智能体游戏以及需要自由形式行为的集体推理系统中。agentscope-samples 模拟了9个智能体的狼人杀游戏。7、层级模式一个顶级规划智能体将子任务分配给工作智能体跟踪它们的进度并做出最终决策。这和经理及其团队的工作方式完全一样很多中间件的架构也是类似这种模式如Redis、ES、Nocas。意图识别就是采用此模式。小节我们一直在思考的一件事不是哪种模式看起来最酷而是哪种模式能最大限度地减少智能体之间的摩擦。启动10个智能体并称之为一个团队很容易。难的是设计沟通流程以确保没有两个智能体会做重复工作。每个智能体都知道何时行动何时等待使这个系统作为一个整体比其任何单个部分都更智能。为此我们遵循 building-effective-agents 设计。三、Multi-Agent 框架多智能体模式将人工智能工作流构建为一个智能体团队它们相互协作每个智能体都有明确的角色。每个智能体能够感知输入、进行推理通过思维链并执行操作以完成子任务。每个智能体通常都配置有特定角色并且只能访问该角色所需的工具或信息。例如PM AGent负责需求判断是否需要其他智能体参与若需要技术决策则联动Tech lead agent。智能体将循环进行思考“思考……”和行动“行动……”直到完成其工作部分的任务。如下图以上简单介绍了多智能体的设计模式那么当下是不是已经有了成熟的架构供我们使用呢答案是肯定的AutoGPTGithub 180k StarDify Github 118k StarAutoGen Github 51.4k StarCrewAIGithub 40.1k StarLangGraph Github 20.6k Star为什么需要使用Agent框架只要“问题不可完全穷举、要跨多系统查证、并且需要在对话中澄清、协商、决策”就更应该用 Agent 框架而不是纯 Workflow。纯 Workflow 的“天花板”Workflow 在对话中的“澄清—再决策—再行动” 并不天然友好需要把每一步提问、回答、重试都画成节点复杂而脆弱。场景用户发起“我的包裹还没到怎么办”通过Workflow创建如下智能体(先不期待GPT-6 会自主思考的智能体)意图识别智能体识别用户诉求查询进度/催促/投诉/报损/退货等物流状态智能体实时拉取承运商状态判断包裹位置、异常政策规则智能体查询当前时段政策节假日、大促、平日判断是否特殊处理用户画像智能体判断用户等级、历史行为、是否会员异常检测智能体分析是否有报损、拒收、欺诈等信号澄清与补充智能体信息不全时自动向用户提问补齐决策所需信息解决方案生成智能体综合所有智能体结果输出最优处理方案比如建议等待/补发/赔偿/升级处理/转人工等智能体数量✖️物流状态✖️用户等级✖️物流政策….你的分支会爆炸。所以需要用Dify这类的可以支持动态决策动态推理和澄清的智能体框架。Agent 框架解决的核心问题以 AutoGen、CrewAI 这类 Agent 框架为例它们把“在对话里动态规划与调用工具”作为第一性能力场景用户说“我10.1买的手机现在还没到给我退货另外你们的运费险的保账期是多久”一个合格的客服 Agent 团队会做什么没有路由决策首先会动态匹配所有Query对Query进行改写成“查询用户的订单”“用户想要退货”“运费险的保账范围和条款”。1.意图识别 澄清Planner Agent拆出多意图物流异常、退货、计费异常、运费险条款先问关键订单号、地址。2.跨系统取证OMS/物流工具查轨迹与 SLA计费/支付工具核对重复扣款交易CRM看是否 Plus、是否有历史补偿记录保库查询运费险3.政策推理与合规Policy Agent套用“假期延误 Plus 运费险”的组合条款评估可给的补偿区间、是否触发风控人工复核。这些动作里很多步骤无法事先“画”成固定分支需要在对话上下文里做决策、需要跨工具动态组合、需要“问一句 → 查一下 → 再决定”这正是 Agent 的强项。结尾以上是对多智能体的总结你会了吗最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】