AI大模型全栈课程技术名词解析

AI大模型全栈课程技术名词解析 一、基础概念层名词解析GPTOpenAI 开发的生成式预训练 Transformer 系列大语言模型是 LLM 领域的标杆产品。RAGRetrieval-Augmented Generation检索增强生成。通过外挂知识库检索来增强 LLM 回答的准确性和时效性解决模型幻觉问题。Agent智能体能够自主感知环境、做出决策并执行动作的 AI 系统可调用工具、规划任务、完成复杂目标。多模态能够同时处理和理解多种数据类型文本、图像、音频、视频的 AI 模型。SoraOpenAI 发布的文本生成视频大模型可生成长达 60 秒的高质量视频。Prompt提示工程通过精心设计的输入指令来引导大模型输出高质量结果的技术。Function Calling大模型识别用户意图后自动调用外部 API/函数来完成特定任务的能力。MCP 协议Model Context ProtocolAnthropic 推出的开放标准协议用于统一 AI 模型与外部数据源、工具的连接方式。二、模型部署与推理层名词解析vLLM高性能 LLM 推理和服务框架采用 PagedAttention 技术大幅提升 GPU 利用率。SGLang结构化生成语言框架用于高效控制和引导大语言模型的输出结构。PagedAttentionvLLM 的核心技术借鉴操作系统虚拟内存的页式管理解决 KV Cache 显存碎片化问题。华为昇腾华为自研的 AI 处理器Ascend及配套软件栈国产替代 NVIDIA GPU 的算力方案。DeepSeek V4DeepSeek 系列大模型的最新版本以高性价比和强推理能力著称。GPU 调度对 GPU 计算资源进行分配和管理的技术涉及显存管理、任务排队、负载均衡等。显存管理对 GPU 显存进行分配、回收和优化的技术直接影响大模型推理的并发能力和成本。三、训练与微调层名词解析LoRALow-Rank Adaptation低秩适应。一种高效的模型微调方法只训练少量低秩矩阵参数大幅降低显存和计算开销。QLoRAQuantized LoRA在 LoRA 基础上引入 4-bit 量化进一步降低微调所需的显存可在消费级 GPU 上微调 65B 模型。蒸馏Knowledge Distillation知识蒸馏。将大模型教师的知识迁移到小模型学生实现模型压缩和加速。YOLOYou Only Look Once经典实时目标检测算法以速度快著称广泛应用于工业质检、自动驾驶等场景。Qwen-VL阿里巴巴通义千问系列的多模态视觉-语言模型能理解图像内容并进行图文对话。四、开发框架与工具层名词解析LangChain最流行的 LLM 应用开发框架提供链式调用、工具集成、记忆管理等模块化组件。LlamaIndex专注于数据索引和检索的 LLM 框架擅长构建 RAG 系统和知识库问答。AutoGen微软开源的多 Agent 协作框架支持多个 AI Agent 之间对话协作完成任务。HuggingFace全球最大的开源 AI 社区和平台提供模型仓库、数据集、Transformers 库等基础设施。Coze字节跳动推出的 AI Bot 开发平台支持低代码方式快速搭建智能体应用。Dify开源的 LLM 应用开发平台支持可视化编排、RAG、Agent、工作流等功能。Claude CodeAnthropic 推出的 AI 编程助手基于 Claude 模型可理解代码库并协助开发。RocketMQ阿里巴巴开源的分布式消息队列用于系统解耦、异步通信和流量削峰。五、项目实战相关名词名词解析OpenManus开源的通用 AI Agent 框架支持自主规划、工具调用和多步骤任务执行。HermesAgent课程自研的多 Agent 协作系统强调长期记忆、自进化和主从调度能力。LLMWiki基于 LLM 的自进化知识库系统融合结构化数据、双向链接和版本控制。向量数据库专门存储和检索高维向量文本/图像的嵌入表示的数据库是 RAG 的核心基础设施。混合检索结合向量检索语义匹配和关键词检索精确匹配的复合搜索策略提升 RAG 效果。Spec CodingSpecification-driven Coding基于规格说明的编码范式AI 根据详细需求文档生成代码。心跳唤醒分布式系统中定时发送心跳信号检测存活状态的机制此处用于 Agent 的自主调度和状态管理。4层颗粒度记忆课程设计的分层记忆架构可能包括对话级、会话级、用户级、全局知识级等不同时间跨度的记忆。六、其他名词解析Git 版本控制分布式版本控制系统用于代码和文档的变更追踪、协作开发和回滚管理。双向链接笔记/知识管理中的链接方式不仅 A→BB 也能自动感知被 A 引用形成知识网络。