Agent Skill 执行逻辑

Agent Skill 执行逻辑 Agent Skill 执行逻辑智能盒子架构中Agent Skill智能插件/工具的执行逻辑是从「非结构化语音输入」到「结构化指令执行」再到「感知反馈」的完整闭环。基于MCP (Model Context Protocol)协议通过Function Calling机制实现。目录整体执行流程核心执行阶段技术实现细节MCP 协议的意义1. 整体执行流程Agent Skill 的执行不是孤立的它与以下模块深度耦合模块说明意图识别解析用户话术路由至对应 Skill长短期记忆存储执行结果支持上下文感知2. 核心执行阶段2.1 第一阶段意图识别与工具匹配 (Intent Routing)步骤说明1. 语音转文字 (ASR)用户输入如「帮我看看明天武汉要不要带伞」2. 意图路由 (Router)中台解析意图若为「查询类」或「控制类」则进入 Skill 匹配3. 可用工具检索 (Discovery)从Available Tools库中根据上下文检索匹配的 Skill如get_weather2.2 第二阶段参数抽取与指令生成 (Parameter Extraction)步骤说明1. 大模型推理将用户输入与工具 Meta 信息JSON Schema投喂给 LLM2. 结构化输出LLM 输出符合标准的JSON 指令而非直接回答3. MCP 插件下沉通过 MCP 协议将 JSON 指令分发至业务逻辑层或边缘端ESP32示例输出{tool:weather_service,params:{city:Wuhan,date:tomorrow}}2.3 第三阶段任务编排与执行 (Orchestration Execution)步骤说明1. 原子化拆解复杂任务如「先开灯再查新闻」被拆分为多个顺序或并行的 Skill 调用2. 闭环执行访问天气 API、搜索接口或 IoT 指令3. 异常处理工具调用失败如接口超时时捕获 Error 并反馈给 LLM 进行自愈或提示用户2.4 第四阶段感知更新与结果润色 (Feedback Response)步骤说明1. 记忆写入执行结果如「武汉明天有雨」存入短期记忆2. 最终回复生成LLM 结合执行结果生成拟人化语音回复3. 基于 Go-zero 的技术实现细节在 go-zero 插件服务中该逻辑表现为以下链路3.1 定义层 (Schema)在 go-zero 的插件服务中定义各 Skill 的输入输出规范。3.2 调用层 (Invocation)// 简化后的工具调度逻辑func(s*SkillEngine)Execute(ctx context.Context,call ToolCall)(string,error){// 1. 意图分发handler,ok:s.registry[call.FunctionName]if!ok{return,ErrToolNotFound}// 2. 权限/上下文检查 (结合 RAG 记忆)// 3. 业务逻辑执行result,err:handler.Do(ctx,call.Arguments)returnresult,nil}4. MCP 协议的意义通过引入MCP (Model Context Protocol)Agent Skill 具备以下优势特性说明标准化无论 Skill 运行在云端天气预报还是边缘端 ESP32红外控制接口协议统一动态性LLM 可根据当前对话上下文动态决定是否增加临时工具实现真正的任务编排安全隔离大模型仅负责「决策」调用哪个工具「执行」权在受控的插件系统中避免注入风险总结Agent Skill 的执行逻辑可概括为「识别 → 拆解 → 执行 → 反馈」。在智能盒子中它不仅完成功能交付更通过执行结果的反馈驱动 AI 长期记忆的更新。