本地部署ollama-尧图企业网站定制

一、docker-compose 文件# gpu services: ollama: image: ollama/ollama:latest deploy: resources: reservations: devices: - driver: nvidia device_ids: [0] # 指定使用哪张卡,不写使用全部卡 capabilities: [gpu] volumes: - ./ollama-data-8b:/root/.ollama ports: - 11434:11434 #cpu services: ollama: image: ollama/ollama:latest volumes: - ./ollama-data-8b:/root/.ollama ports: - 11434:11434 # 可选给 CPU 限制资源 deploy: resources: limits: cpus: 8 # 最多用 8 核 CPU memory: 16G # 最多用 16G 内存二、常用命令命令功能常用示例ollama run 模型名下载并运行或直接运行一个模型。ollama run llama3.2ollama pull 模型名仅下载模型不运行。ollama pull deepseek-r1:7bollama list列出本地已下载的所有模型。ollama listollama ps查看当前正在运行的模型实例。ollama psollama stop 模型名停止某个正在运行的模型。ollama stop llama3ollama rm 模型名从本地删除一个模型。ollama rm mistralollama serve启动API服务以便通过代码调用。ollama serveollama create 自定义名 -f ./Modelfile使用Modelfile配置文件创建自定义模型。ollama create mymodel -f ./Modelfileollama logs查看模型运行的日志用于调试。ollama logsollama help查看所有命令的帮助信息。ollama help

相关新闻

如何在Linux系统上高效安装Photoshop CC 2020：完整配置指南

Swin2SR部署实战：基于Docker的免配置环境搭建

gemma-3-12b-it实际作品：10张不同领域测试图的图文理解准确率统计表

Pearcleaner终极指南：如何彻底清理Mac应用残留，释放宝贵存储空间

5分钟解决Umi-OCR启动崩溃：OCR引擎插件缺失的终极修复指南

第一次做 PD 分离推理？先了解 hixl 能做什么

这个Skill太香了！Karpathy说的AI写代码的毛病，直接治好

FFF音频文件搜索终极指南：如何快速按ID3标签查找音乐文件

为什么92%的内部工具项目半年后被弃用？Lovable团队内部复盘：5个致命设计缺陷与重构路径

【AI Daily】AI日报 | 2026-05-24

Go语言MongoDB文档数据库操作指南

【前端无障碍】无障碍测试：确保你的应用对所有人友好

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势