Windows11 Docker Ollama MaxKB 本地知识库完整部署方案本文基于实际部署过程整理适用于Windows 11WSL – Ubuntu – Docker – MaxKB 本地知识库Ollama 本地模型 – Qwen3 8B大预言模型 – Embedding向量数据库一、整体架构推荐架构Windows11 ├─ Ollama本地模型 └─ Qwen3 8B └─ Embedding │ └─ WSL Ubuntu └─ Docker(MaxKB)推荐原因Ollama 在 Windows 运行更稳定GPU 调用更方便Docker Desktop 与 WSL 集成成熟MaxKB 使用 Docker 部署最简单二、环境准备1. Windows 11 开启 WSL管理员 PowerShellwsl--install安装完成后重启电脑。2. 安装 UbuntuMicrosoft Store 搜索Ubuntu推荐Ubuntu 22.04 LTS2、安装更新你现有的软件包列表并为下面的步骤安装一些依赖项。 ca-certificates, curl, gnupg 和 lsb_release 工具将被用来下载正确的Docker apt 仓库细节和你系统的签名密钥。尽管你可能已经有了这些软件包但确保它们是可用的也无妨。sudo apt update sudo apt install ca-certificates curl gnupg lsb-release安装最新版本dockersudo apt-get install docker-ce docker-ce-cli containerd.io docker-compose-plugin添加 Docker 官方 GPG 密钥curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg添加 Docker 官方软件源echo deb [arch$(dpkg --print-architecture) signed-by/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable | sudo tee /etc/apt/sources.list.d/docker.list /dev/null再次更新源sudo apt-get update3. 验证 DockerUbuntu 终端docker-v如果报permission denied while trying to connect to docker.sock执行当前用户赋予权限操作 Dockersudousermod-aGdocker$USERnewgrpdocker或者关闭终端重新进入。三、部署 MaxKB1. 拉取并启动 MaxKBUbuntu 中执行下面是一个命令请全部复制dockerrun-d\--namemaxkb\--restartalways\-p8080:8080\-v~/.maxkb:/opt/maxkb\registry.fit2cloud.com/maxkb/maxkb2. 查看运行状态dockerps看到maxkb 0.0.0.0:8080-8080/tcp说明成功。3. 浏览器访问查看 WSL 真实 IP在 Ubuntu 终端输入hostname -I你会得到一串类似这样的 IP192.168.xxx.xxx使用获得的IP进行访问http://192.168.xxx.xxx:8080四、安装 Ollama推荐 Windows 安装推荐Windows 安装 Ollama 不要在 WSL 中安装原因WSL 下载 GitHub 容易失败Windows GPU 支持更稳定Docker 调用更简单1. 下载 Ollama官方下载需要梯子https://ollama.com/download/windows安装后自动启动。2. 验证 Ollama浏览器打开http://localhost:11434出现Ollama is running说明成功。五、下载推荐模型1. 聊天模型LLM推荐Qwen3 8BWindows PowerShellollama pull qwen3:8b优点中文能力强企业知识库效果优秀资源占用适中2. Embedding 向量模型必须推荐bge-m3ollama pull bge-m3作用知识库检索文档向量化提高命中率3. 查看模型ollama list应看到qwen3:8b bge-m3六、配置 Ollama 外部访问重要默认 Ollama 只允许本机访问。MaxKB 在 Docker 中需要开放访问。1. 设置系统环境变量Windows 搜索环境变量打开编辑系统环境变量新增变量名值OLLAMA_HOST0.0.0.0:114342. 重启 Ollama任务栏右键 Ollama → Quit重新打开 Ollama。七、配置 MaxKB 接入 Ollama进入http://192.168.xxx.xxx:8080账户admin 密码MaxKB123..1. 添加聊天模型进入系统设置 → 模型设置 → 添加模型选择Ollama配置参数项内容API 域名http://host.docker.internal:11434API Keyollama模型名qwen3:8b注意不要加 /v1某些 MaxKB 版本会提示API 域名无效2. 添加 Embedding 模型同样方式项内容API 域名http://host.docker.internal:11434API Keyollama模型名bge-m3八、常见问题汇总1. docker.sock 权限错误报错permission denied while trying to connect to docker.sock解决sudousermod-aGdocker$USERnewgrpdocker2. MaxKB 无法访问 Ollama原因Ollama 默认只监听 127.0.0.1解决配置OLLAMA_HOST0.0.0.0:114343. API 域名无效原因部分 MaxKB 版本不允许/v1校验 URL 格式正确http://host.docker.internal:11434错误http://host.docker.internal:11434/v14. Ollama 下载慢原因国内访问 GitHub 慢。解决推荐Windows 安装 Ollama不要在 WSL 下载。5. C 盘空间暴涨原因Ollama 模型Docker 镜像WSL 虚拟磁盘清理dockersystem prune-a查看模型ollama list删除模型ollamarm模型名九、推荐最终方案类型推荐聊天模型qwen3:8bembeddingbge-m3rerank暂不配置这是目前中文本地知识库 最稳定 兼容最好 效果最均衡的一套方案。
MaxKB本地知识库AI大模型部署(Windows 11 + WSL + Ubuntu + docker + MaxKB) (Ollama + Qwen3 8B + Embedding)
Windows11 Docker Ollama MaxKB 本地知识库完整部署方案本文基于实际部署过程整理适用于Windows 11WSL – Ubuntu – Docker – MaxKB 本地知识库Ollama 本地模型 – Qwen3 8B大预言模型 – Embedding向量数据库一、整体架构推荐架构Windows11 ├─ Ollama本地模型 └─ Qwen3 8B └─ Embedding │ └─ WSL Ubuntu └─ Docker(MaxKB)推荐原因Ollama 在 Windows 运行更稳定GPU 调用更方便Docker Desktop 与 WSL 集成成熟MaxKB 使用 Docker 部署最简单二、环境准备1. Windows 11 开启 WSL管理员 PowerShellwsl--install安装完成后重启电脑。2. 安装 UbuntuMicrosoft Store 搜索Ubuntu推荐Ubuntu 22.04 LTS2、安装更新你现有的软件包列表并为下面的步骤安装一些依赖项。 ca-certificates, curl, gnupg 和 lsb_release 工具将被用来下载正确的Docker apt 仓库细节和你系统的签名密钥。尽管你可能已经有了这些软件包但确保它们是可用的也无妨。sudo apt update sudo apt install ca-certificates curl gnupg lsb-release安装最新版本dockersudo apt-get install docker-ce docker-ce-cli containerd.io docker-compose-plugin添加 Docker 官方 GPG 密钥curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg添加 Docker 官方软件源echo deb [arch$(dpkg --print-architecture) signed-by/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable | sudo tee /etc/apt/sources.list.d/docker.list /dev/null再次更新源sudo apt-get update3. 验证 DockerUbuntu 终端docker-v如果报permission denied while trying to connect to docker.sock执行当前用户赋予权限操作 Dockersudousermod-aGdocker$USERnewgrpdocker或者关闭终端重新进入。三、部署 MaxKB1. 拉取并启动 MaxKBUbuntu 中执行下面是一个命令请全部复制dockerrun-d\--namemaxkb\--restartalways\-p8080:8080\-v~/.maxkb:/opt/maxkb\registry.fit2cloud.com/maxkb/maxkb2. 查看运行状态dockerps看到maxkb 0.0.0.0:8080-8080/tcp说明成功。3. 浏览器访问查看 WSL 真实 IP在 Ubuntu 终端输入hostname -I你会得到一串类似这样的 IP192.168.xxx.xxx使用获得的IP进行访问http://192.168.xxx.xxx:8080四、安装 Ollama推荐 Windows 安装推荐Windows 安装 Ollama 不要在 WSL 中安装原因WSL 下载 GitHub 容易失败Windows GPU 支持更稳定Docker 调用更简单1. 下载 Ollama官方下载需要梯子https://ollama.com/download/windows安装后自动启动。2. 验证 Ollama浏览器打开http://localhost:11434出现Ollama is running说明成功。五、下载推荐模型1. 聊天模型LLM推荐Qwen3 8BWindows PowerShellollama pull qwen3:8b优点中文能力强企业知识库效果优秀资源占用适中2. Embedding 向量模型必须推荐bge-m3ollama pull bge-m3作用知识库检索文档向量化提高命中率3. 查看模型ollama list应看到qwen3:8b bge-m3六、配置 Ollama 外部访问重要默认 Ollama 只允许本机访问。MaxKB 在 Docker 中需要开放访问。1. 设置系统环境变量Windows 搜索环境变量打开编辑系统环境变量新增变量名值OLLAMA_HOST0.0.0.0:114342. 重启 Ollama任务栏右键 Ollama → Quit重新打开 Ollama。七、配置 MaxKB 接入 Ollama进入http://192.168.xxx.xxx:8080账户admin 密码MaxKB123..1. 添加聊天模型进入系统设置 → 模型设置 → 添加模型选择Ollama配置参数项内容API 域名http://host.docker.internal:11434API Keyollama模型名qwen3:8b注意不要加 /v1某些 MaxKB 版本会提示API 域名无效2. 添加 Embedding 模型同样方式项内容API 域名http://host.docker.internal:11434API Keyollama模型名bge-m3八、常见问题汇总1. docker.sock 权限错误报错permission denied while trying to connect to docker.sock解决sudousermod-aGdocker$USERnewgrpdocker2. MaxKB 无法访问 Ollama原因Ollama 默认只监听 127.0.0.1解决配置OLLAMA_HOST0.0.0.0:114343. API 域名无效原因部分 MaxKB 版本不允许/v1校验 URL 格式正确http://host.docker.internal:11434错误http://host.docker.internal:11434/v14. Ollama 下载慢原因国内访问 GitHub 慢。解决推荐Windows 安装 Ollama不要在 WSL 下载。5. C 盘空间暴涨原因Ollama 模型Docker 镜像WSL 虚拟磁盘清理dockersystem prune-a查看模型ollama list删除模型ollamarm模型名九、推荐最终方案类型推荐聊天模型qwen3:8bembeddingbge-m3rerank暂不配置这是目前中文本地知识库 最稳定 兼容最好 效果最均衡的一套方案。