Agent 系列（19）：Harness 完整体系——8 层防护框架全景-尧图企业网站定制

从五要素到八层框架第 17 篇介绍了 Harness 的五个要素：动作空间、人工检查点、执行边界、审计日志、回滚。五要素是骨架，能处理大多数场景。但生产级 Agent 面对的威胁更复杂：LLM 被提示注入操控，绕过工具白名单用合法工具实现非法意图多步推理耗尽 Token 预算，系统雪崩审计日志被事后篡改，合规失效模型报告"已执行"，但实际状态已被回滚——谁的话算数？完整的 8 层框架在五要素基础上增加了三层主动防御：Layer 1 Minimal Footprint 最小权限：任务只暴露必要工具 Layer 2 Action Space Registry 动作注册表：PermissionLevel 枚举，每个动作有 budget_cost Layer 3 Permission Budget 权限预算：spend() / BudgetExhaustedError Layer 4 Execution Sandbox 执行沙箱：输入净化 + 子进程隔离 Layer 5 Human Checkpoint 人工检查点：LangGraph interrupt（第 17 篇详述） Layer 6 Immutable Audit Log 不可篡改审计日志：哈希链 JSONL + 完整性验证 Layer 7 Rollback Coordinator 回滚协调器：事务 context manager Layer 8 Threat Model 威胁模型：对抗场景测试本文用实测数据覆盖全部 8 层，附三个反直觉结论。Layer 1：最小权限——任务决定工具范围核心思路：不同任务类型只暴露必要工具，LLM 连其他工具的存在都不知道。TASK_TOOL_MAP:dict[str,list]={"read_only":[read_data],"reporting":[read_data,send_report],"data_entry":[read_data,write_data],"admin":[read_data,write_data,send_report,delete_record],}defget_tools_for_task(task_type:str)-list:returnTASK_TOOL_MAP.get(task_type,[read_data])每种任务类型的工具子集：Task type → Available tools read_only → ['read_data'] reporting → ['read_data', 'send_report'] data_entry → ['read_data', 'write_data'] admin → ['read_data', 'write_data', 'send_report', 'delete_record']read_only任务下，模型完全不知道write_data、delete_record的存在——bind_tools()只传入该任务的工具子集。实测：read_onlyAgent 查询sales_q1，预算消耗 1（一次read_data），没有任何越权行为。Layer 2 3：注册表 + 权限预算注册表设计：每个动作声明权限等级和预算成本。classPermissionLevel(Enum):READ=1WRITE=2ADMIN=3IRREVERSIBLE=4@dataclassclassRegisteredAction:name:strlevel:PermissionLevel budget_cost:intdescription:strhandler:Any ACTION_REGISTRY:dict[str,RegisteredAction]={"read_data":RegisteredAction("read_data",READ,1,"Read a record",read_data),"write_data":RegisteredAction("write_data",WRITE,3,"Write/update a record",write_data),"send_report":RegisteredAction("send_report",WRITE

相关新闻

C语言基础语法，分支语句

2026年商务资源对接平台哪个好用？实测数据告诉你

2026年，临沂兰陵眼镜店维修保养秘籍

Zotero GPT插件：5分钟打造你的智能文献研究助手

番茄小说免费下载神器：一键保存全网小说完整指南

给FPGA新手的保姆级教程：用Vivado 2015.4在MINISYS-1开发板上点亮第一个LED

无人机视角洪水识别分割数据集labelme格式1173张2类别

Android硬编解码实战工程：MediaCodec编码H264+OpenGL渲染，支持相机采集、VP8解码与后台持续编码

从“电通量”到“高斯定理”：用Python模拟电场分布，直观理解大学物理电磁学核心

深入S32K3时钟树：从FIRC到PLL，如何用S32DS为你的应用选对时钟源？

i.MX 6SoloX异构处理器开发实战：A9与M4协同、安全启动与性能优化

i.MX 7ULP异构处理器：架构解析与低功耗物联网开发实战

陪诊小程序开发玩法分析：全流程就医服务架构、匹配机制与落地方案

从“大通铺”到“写字楼”的链路层进化史

RAG 召回质量治理：用 Go 构建可调试的切片、检索与重排链路

从陌生到熟悉：Royal TSX中文汉化包的体验地图之旅

时延最优化设计

别再重启了！Windows 11下dwm.exe内存飙升，我用Intel官方工具升级显卡驱动搞定