我叫老王写代码的年头到今天刚好九年。前七年都在跟 Spring Boot、React、Vue、MySQL、Node.js、Python 这些东西较劲标准的增删改查熟练工。大概两年前ChatGPT 出来之后我开始折腾 AI一开始只是调接口做个聊天机器人后来看到 AutoGPT 那个东西自己在命令行里搜网页、写文件、还给自己分配任务说实话那一瞬间我感觉自己学了七年的编程方法论被什么东西撞了一下腰。我花了两个通宵去跑 AutoGPT 的代码结果很惨烈。API 费用烧了大几十美元它经常陷入死循环要么 JSON 解析失败要么调用了一个不存在的工具然后原地发呆。我盯着满屏的 error log脑子里只有一个念头我必须从零开始一行一行把它写出来不然我永远不知道这东西到底是怎么转起来的。后来我关掉所有现成的框架建了一个空文件夹取名 manus-agent那时候还没人用 Manus 这个名字我就是觉得这词儿有“手”的意思Agent 本来就应该能动手干活。我给自己定了个死规矩每加一个功能之前必须先弄明白它为什么会出现在那里以及它坏了该怎么修。这个专栏就是把我从那个空文件夹开始一直到现在做出一个能跑在生产环境、支持多 Agent 协作、有完整前端面板的智能体系统整个过程完整地拆开揉碎了带你重新走一遍。你不是在学一个黑盒框架你是在和我一起一行一行把这个系统给造出来。我画了一张图就是这个专栏的完整学习路线。你先花两分钟把它看明白后面的199篇文章你会一直知道自己在什么位置在往哪个方向走。你可以把这个图存下来以后每次不知道今天该干啥的时候就翻出来看一眼。在这个专栏的前20篇我会带着你在空文件夹里用 TypeScript 搭一个 Node.js 项目接上 OpenAI 的 API写一个最简陋的 while循环接收用户输入送给 LLM拿到回复如果有工具调用就执行工具再把结果喂回去。就这一个循环我们就会手写工具描述解析、工具路由、多轮对话记忆、会话持久化。第20篇结束的时候你电脑上会跑着一个命令行版的 Agent它能跟你聊天也能查天气。能跑起来只是第一步。接下来你要面对的是同一个问题怎么不重复调 API缓存、长任务怎么不让用户干等队列、对话历史怎么记得住又读得快向量数据库、怎么保证 API 不被人刷爆限流和鉴权。这些就是后端基建。我们会从安装 Redis 开始一路搞到 OpenTelemetry 分布式追踪和 k6 压力测试。这个阶段结束你的 Agent 就不再是一个玩具脚本而是一个扛得住折腾的后端服务。从第71篇开始我们会引入多 Agent 协作。我会带着你用 XState 状态机来控制任务分发让搜索 Agent、代码 Agent、评审 Agent 各司其职。第一次看到三个 Agent 同时干活最后汇总出一个漂亮的结果时你大概率会跟我一样对着屏幕傻笑。这个专栏的最后4篇我会教你怎么写产品文档、怎么搭建在线演示环境、怎么写一份让面试官眼睛发光的复盘报告。说实话这套流程我自己走了一遍之后简历上的项目描述完全换了个档次。你可能注意到了这199篇的路线图里我一句都没提“前端岗位”或者“后端岗位”。因为 Agent 开发这件事天然就是全栈的。你既要懂后端怎么高效调用模型、管理上下文也要懂前端怎么把 Agent 的思考过程展现给用户。不管你之前是做哪块的跟着这个专栏走完你就是一个能独当一面的 Agent 全栈开发者。最后说句掏心窝子的话。这两年我越来越觉得Agent 不是什么高不可攀的技术它更像是一套工程方法论。你需要的不是一个魔法师带你飞而是一个扛过锄头、挖过坑的工头告诉你哪里石头硬哪里水太深。我就是那个工头。我是老王咱们专栏里见。
从零开始学习AI Agent的实战路线图
我叫老王写代码的年头到今天刚好九年。前七年都在跟 Spring Boot、React、Vue、MySQL、Node.js、Python 这些东西较劲标准的增删改查熟练工。大概两年前ChatGPT 出来之后我开始折腾 AI一开始只是调接口做个聊天机器人后来看到 AutoGPT 那个东西自己在命令行里搜网页、写文件、还给自己分配任务说实话那一瞬间我感觉自己学了七年的编程方法论被什么东西撞了一下腰。我花了两个通宵去跑 AutoGPT 的代码结果很惨烈。API 费用烧了大几十美元它经常陷入死循环要么 JSON 解析失败要么调用了一个不存在的工具然后原地发呆。我盯着满屏的 error log脑子里只有一个念头我必须从零开始一行一行把它写出来不然我永远不知道这东西到底是怎么转起来的。后来我关掉所有现成的框架建了一个空文件夹取名 manus-agent那时候还没人用 Manus 这个名字我就是觉得这词儿有“手”的意思Agent 本来就应该能动手干活。我给自己定了个死规矩每加一个功能之前必须先弄明白它为什么会出现在那里以及它坏了该怎么修。这个专栏就是把我从那个空文件夹开始一直到现在做出一个能跑在生产环境、支持多 Agent 协作、有完整前端面板的智能体系统整个过程完整地拆开揉碎了带你重新走一遍。你不是在学一个黑盒框架你是在和我一起一行一行把这个系统给造出来。我画了一张图就是这个专栏的完整学习路线。你先花两分钟把它看明白后面的199篇文章你会一直知道自己在什么位置在往哪个方向走。你可以把这个图存下来以后每次不知道今天该干啥的时候就翻出来看一眼。在这个专栏的前20篇我会带着你在空文件夹里用 TypeScript 搭一个 Node.js 项目接上 OpenAI 的 API写一个最简陋的 while循环接收用户输入送给 LLM拿到回复如果有工具调用就执行工具再把结果喂回去。就这一个循环我们就会手写工具描述解析、工具路由、多轮对话记忆、会话持久化。第20篇结束的时候你电脑上会跑着一个命令行版的 Agent它能跟你聊天也能查天气。能跑起来只是第一步。接下来你要面对的是同一个问题怎么不重复调 API缓存、长任务怎么不让用户干等队列、对话历史怎么记得住又读得快向量数据库、怎么保证 API 不被人刷爆限流和鉴权。这些就是后端基建。我们会从安装 Redis 开始一路搞到 OpenTelemetry 分布式追踪和 k6 压力测试。这个阶段结束你的 Agent 就不再是一个玩具脚本而是一个扛得住折腾的后端服务。从第71篇开始我们会引入多 Agent 协作。我会带着你用 XState 状态机来控制任务分发让搜索 Agent、代码 Agent、评审 Agent 各司其职。第一次看到三个 Agent 同时干活最后汇总出一个漂亮的结果时你大概率会跟我一样对着屏幕傻笑。这个专栏的最后4篇我会教你怎么写产品文档、怎么搭建在线演示环境、怎么写一份让面试官眼睛发光的复盘报告。说实话这套流程我自己走了一遍之后简历上的项目描述完全换了个档次。你可能注意到了这199篇的路线图里我一句都没提“前端岗位”或者“后端岗位”。因为 Agent 开发这件事天然就是全栈的。你既要懂后端怎么高效调用模型、管理上下文也要懂前端怎么把 Agent 的思考过程展现给用户。不管你之前是做哪块的跟着这个专栏走完你就是一个能独当一面的 Agent 全栈开发者。最后说句掏心窝子的话。这两年我越来越觉得Agent 不是什么高不可攀的技术它更像是一套工程方法论。你需要的不是一个魔法师带你飞而是一个扛过锄头、挖过坑的工头告诉你哪里石头硬哪里水太深。我就是那个工头。我是老王咱们专栏里见。