通过AI大模型对IT系统蒸馏:构建独立Skills技能包的实操方案

通过AI大模型对IT系统蒸馏:构建独立Skills技能包的实操方案 本文整理自 B 站「通过AI大模型对IT系统蒸馏-构建提供业务能力的Skills技能包」通过音视频总结整理工具Ai好记进行视频转图文整理以下为精炼整理后的内容。为什么要蒸馏蒸馏的核心目的是把一个业务系统变成没有前端页面的「能力提供中心」。说白了就是把整个业务系统的底层能力通过 API 接口暴露给 AI 大模型让它能用自然语言直接操作业务系统。关键原则是不直接把数据库暴露给 AI。而是把业务系统通过 API 接口能力包装好再交给 AI 调用。AI 只跟 API 打交道碰不到底层的数据库和数据表。蒸馏的输入蒸馏不是凭空搞出来的需要喂原始资料给 AI。可用的输入包括原始需求文档架构设计文档源代码接口文档本体模型文档把这些资料投喂给 AIAI 基于这些文档进行蒸馏最终会生成一套完整的 Markdown 文档统一放到distilled/目录下。蒸馏产出的文档结构蒸馏完成后会得到以下内容API 接口蒸馏把业务系统的接口抽象成 AI 可调用的能力领域对象蒸馏明确核心业务对象和关系参考数据结构和数据模型提供数据结构定义枚举值表列举业务中的常量与枚举原始需求蒸馏保留原始业务需求上下文整体业务系统蒸馏系统性的全景描述蒸馏的六条原则1. 语义层和明细层分离整套蒸馏文档支持渐进式推理和惰性加载——核心语义层常驻内存明细层按需调用。不用一次性加载全部。2. 粗颗粒度 API 接口不是把每个数据库表都发布成一个 CRUD 接口而是以领域对象 业务用例为颗粒度提供粗粒度的 API。比如「创建合同」而不是「INSERT INTO contract」。3. 规则标注每条规则都必须标注谁来定这条规则、谁来保证它被执行。4. 事实优先级明确蒸馏出来的信息要有明确的优先级排序不把次要信息和核心规则混在一起。5. 权限分解不同能力的访问权限要明确区分AI 不能越权操作。6. 可验证每个蒸馏结果都要能验证——人工或自动化检查都可以但必须可验证。蒸馏流程S0 到 S6整个过程分七步S0已有资料盘点S1抽象核心对象关系S2立项规则S3抽取核心 API 接口列表S4形成关联明细数据S5引用和编排S6迭代和验证三层产出结构最终形成的蒸馏产出分为三个层级语义层L1 ← 常驻内存包含核心元数据和业务语义 │ API 能力层L2 ← 提供粗粒度业务 API 接口 │ 明细层L3 ← 按需加载包含详细的参考数据L1 语义层常驻内存快速响应L2 API 能力层封装好的业务 APIL3 明细层按需加工使用蒸馏后的使用流程用户通过自然语言发出请求比如「查一下合同编号为 XXXX 的详细信息」整个流程是这样的自然语言请求对接大模型大模型加载蒸馏技能包的L1 语义层意图识别完成确定需要调用哪些底层API 接口调用 API 能力层跨多个接口组装数据访问数据库查询具体数据结果整合返回给用户整个过程的好处两句话就能说清楚数据库隔离AI 不直接访问数据库安全风险大幅降低响应快L1 常驻内存L3 按需加载避免了所有数据一次性加载的损耗实测效果演示基于这套蒸馏方案作者做了一个合同管理的演示「帮我查询最新的 5 条合同信息」→ 立刻列出「帮我查某个编号的合同详细信息和基本信息」→ 完整展现「帮我统计已签订合同的总金额」→ 自动统计「帮我把上图转变成多列的柱状图」→ 图表自动生成「合同管理的端到端流程是怎样的」→ 完整流程回应AI 对自然语言的语义理解很准确。遇到复杂需求它会自动拆解为多个步骤每一步调用不同的 API在能力层内部做好接口组装。小结蒸馏技能包的核心价值在于让大模型以标准化、可控的方式对接已有的 IT 系统。不是推翻重来而是在现有系统之上加一层 AI 可理解的能力层。企业已有的业务逻辑、权限体系、数据模型不需要变只需要蒸馏成标准化的技能包。如果你手头有现成的业务系统可以试试这套蒸馏流程——把原始需求文档、接口文档喂给 AI生成蒸馏文档然后打包成技能包用自然语言测试一下效果。FAQ蒸馏和传统 API 网关有什么区别API 网关管的是路由和流量蒸馏管的是 AI 的理解层面——告诉大模型每个 API 是做什么的、怎么调用、参数怎么传、返回怎么解析。蒸馏后原来的 UI 还有用吗有用。蒸馏不代表去掉前端而是多了一个 AI 入口。原来该用 UI 的继续用AI 适合的场景走自然语言两者并行。这套方案适合多大体量的系统理论上不限规模。但从实操角度建议先从一个业务域比如合同管理、订单管理开始试点验证后再扩展。以上内容由Ai好记转录整理。Ai好记 是一款音视频转图文笔记的AI知识库工具支持解析B站、抖音、小宇宙等平台链接及本地/网盘音视频文件转写后自动生成精华速览、思维导图和结构化笔记等内容帮助你把几小时的视频内容变成可搜索、可复习的图文笔记。