冶金行业智能体与领域模型微调建设项目领域智能体 · 大模型训练 · 微调实践一、开场介绍大家好最近我聚焦冶金领域围绕行业专属智能体开发、大模型训练与微调工作开展了一系列实践接下来就把这段时间的阶段性成果和思考跟大家做个简单分享。二、项目背景当前冶金行业平台已积累大量行业文档数据传统检索功能能够满足基础信息查询需求整体效果稳定可靠。但平台目前尚不具备 AI 相关能力在内容理解、智能问答、知识推理、多源信息整合等方面仍有提升空间。本次工作主要围绕大模型与领域智能体展开通过引入 AI 能力进一步提升冶金行业平台的智能化水平与用户使用体验。三、系统模块划分与 API 调用逻辑整个架构分三层最上方是项目需求智能问答、智能问数、报告写作、智能检索、文献理解、机器翻译中间是知识库、多模态数据抽取与 API 调用共同构成知识与中台能力最下方是通用组件负责登录、权限、存储等基础运维。需求驱动上层能力落地全产品依赖知识库与数据抽取链路通用组件保障稳定运行。图系统模块划分与 API 调用逻辑第一层项目需求第二层知识库、多模态数据抽取、API 调用第三层通用组件登录、权限、存储、运维四、演示并强调页面嵌入与复用以下能力可通过统一门户或 页面嵌入如 iframeqiankun复用并与 SSO、知识库衔接保持体验一致、降低重复开发。SSO登录单点登录对接统一身份与入口安全。知识库领域文档与结构化知识的统一存储与检索底座。智能问答基于知识库与模型的多轮对话与溯源回答。智能检索语义与关键词结合的文献、资料智能检索。报告写作行业报告起草、润色与结构辅助。智能问数面向数据与指标的自然语言查询与分析辅助。文献理解长文摘要、要点提取与结构化理解。机器翻译多语言内容转换服务检索与国际交流场景。五、模型训练与领域微调规范流程面向国产化操作系统与算力环境将「数据—格式—训练—评测—部署」串成可复用的领域微调链路推理侧以统一推理服务为基座训练侧以主流微调工具为主线。1. 环境与推理基座适配国产化操作系统与算力栈部署推理服务完成基座模型选型与吞吐、延迟等验证为后续微调目标与部署形态定标。2. 语料与数据合成多模态数据抽取产出规范化 Markdown 语料经数据合成流水线做指令/对话样本合成与增广形成可版本管理的训练集。3. 训练数据格式化编写脚本将语料转换为训练工具要求的微调数据格式字段约定、角色与对话结构一致保证训练可读、可审计、可复现。4. 模型微调训练在微调工具中配置训练如 LoRA / 全参等按资源与效果选择在国产化环境下完成训练任务编排与模型版本管理。5. 评测与上线开展离线评测与业务向抽检通过后对接统一推理网关完成部署与版本发布纳入日常监控与回滚策略。六、收尾总结以上工作可归纳为以下几方面在海量行业文档与既有检索能力之上补齐理解、问答、推理与多源整合等 AI 能力推动冶金行业平台向智能化服务演进。三层架构将「六项业务能力—知识库与多模态抽取、API—登录与权限、存储与运维」分层落实上层对接场景中层统一知识与接口下层夯实通用底座。通过 SSO 与页面嵌入把知识库、智能问答与问数、检索与报告、文献理解与翻译等能力按序接入门户体验一致、集成成本低。在国产化算力环境下走通「Markdown 语料 → 数据合成 → 脚本格式化 → 模型训练 → 评测与推理部署」的领域微调闭环与业务架构形成配套。由此形成可复用的组件、接口与数据—模型流水线既满足当前建设目标也便于后续扩展场景与迭代模型。视频地址https://www.bilibili.com/video/BV1SNEc6YEJn/?vd_source14bcff2edf395c30f806c2424102e70c
AI智能体与领域模型微调建设项目
冶金行业智能体与领域模型微调建设项目领域智能体 · 大模型训练 · 微调实践一、开场介绍大家好最近我聚焦冶金领域围绕行业专属智能体开发、大模型训练与微调工作开展了一系列实践接下来就把这段时间的阶段性成果和思考跟大家做个简单分享。二、项目背景当前冶金行业平台已积累大量行业文档数据传统检索功能能够满足基础信息查询需求整体效果稳定可靠。但平台目前尚不具备 AI 相关能力在内容理解、智能问答、知识推理、多源信息整合等方面仍有提升空间。本次工作主要围绕大模型与领域智能体展开通过引入 AI 能力进一步提升冶金行业平台的智能化水平与用户使用体验。三、系统模块划分与 API 调用逻辑整个架构分三层最上方是项目需求智能问答、智能问数、报告写作、智能检索、文献理解、机器翻译中间是知识库、多模态数据抽取与 API 调用共同构成知识与中台能力最下方是通用组件负责登录、权限、存储等基础运维。需求驱动上层能力落地全产品依赖知识库与数据抽取链路通用组件保障稳定运行。图系统模块划分与 API 调用逻辑第一层项目需求第二层知识库、多模态数据抽取、API 调用第三层通用组件登录、权限、存储、运维四、演示并强调页面嵌入与复用以下能力可通过统一门户或 页面嵌入如 iframeqiankun复用并与 SSO、知识库衔接保持体验一致、降低重复开发。SSO登录单点登录对接统一身份与入口安全。知识库领域文档与结构化知识的统一存储与检索底座。智能问答基于知识库与模型的多轮对话与溯源回答。智能检索语义与关键词结合的文献、资料智能检索。报告写作行业报告起草、润色与结构辅助。智能问数面向数据与指标的自然语言查询与分析辅助。文献理解长文摘要、要点提取与结构化理解。机器翻译多语言内容转换服务检索与国际交流场景。五、模型训练与领域微调规范流程面向国产化操作系统与算力环境将「数据—格式—训练—评测—部署」串成可复用的领域微调链路推理侧以统一推理服务为基座训练侧以主流微调工具为主线。1. 环境与推理基座适配国产化操作系统与算力栈部署推理服务完成基座模型选型与吞吐、延迟等验证为后续微调目标与部署形态定标。2. 语料与数据合成多模态数据抽取产出规范化 Markdown 语料经数据合成流水线做指令/对话样本合成与增广形成可版本管理的训练集。3. 训练数据格式化编写脚本将语料转换为训练工具要求的微调数据格式字段约定、角色与对话结构一致保证训练可读、可审计、可复现。4. 模型微调训练在微调工具中配置训练如 LoRA / 全参等按资源与效果选择在国产化环境下完成训练任务编排与模型版本管理。5. 评测与上线开展离线评测与业务向抽检通过后对接统一推理网关完成部署与版本发布纳入日常监控与回滚策略。六、收尾总结以上工作可归纳为以下几方面在海量行业文档与既有检索能力之上补齐理解、问答、推理与多源整合等 AI 能力推动冶金行业平台向智能化服务演进。三层架构将「六项业务能力—知识库与多模态抽取、API—登录与权限、存储与运维」分层落实上层对接场景中层统一知识与接口下层夯实通用底座。通过 SSO 与页面嵌入把知识库、智能问答与问数、检索与报告、文献理解与翻译等能力按序接入门户体验一致、集成成本低。在国产化算力环境下走通「Markdown 语料 → 数据合成 → 脚本格式化 → 模型训练 → 评测与推理部署」的领域微调闭环与业务架构形成配套。由此形成可复用的组件、接口与数据—模型流水线既满足当前建设目标也便于后续扩展场景与迭代模型。视频地址https://www.bilibili.com/video/BV1SNEc6YEJn/?vd_source14bcff2edf395c30f806c2424102e70c