单端口部署多模型最简单解决方案（vllm sglang 等均适用）-尧图企业网站定制

TLDR将不同模型部署在不同端口使用litellm的proxy功能统一管理转发步骤1本地部署好模型在若干端口上vllm serve Qwen/Qwen3.5-2B --port 8031 vllm serve Qwen/Qwen3.5-4B --port 8032 vllm serve Qwen/Qwen3.5-9B --port 8033步骤2安装配置litellm安装# 选项1使用uv安装 uv tool install litellm[proxy] # 选项2脚本直接安装 curl -fsSL https://raw.githubusercontent.com/BerriAI/litellm/main/scripts/install.sh | sh配置litellm当前目录创建litellm_config.yaml写入以下内容model_list: - model_name: Qwen/Qwen3.5-4B litellm_params: model: openai/Qwen/Qwen3.5-4B # add openai/ prefix to route as OpenAI provider api_base: http://localhost:8031/v1 api_key: none - model_name: Qwen/Qwen3.5-2B litellm_params: model: openai/Qwen/Qwen3.5-2B # add openai/ prefix to route as OpenAI provider api_base: http://localhost:8032/v1 api_key: none - model_name: Qwen/Qwen3.5-9B litellm_params: model: openai/Qwen/Qwen3.5-9B # add openai/ prefix to route as OpenAI provider api_base: http://localhost:8033/v1 api_key: none步骤3用你需要的端口启动litellmlitellm --config ./litellm_config.yaml --port 8088然后如下之后直接使用8088端口就可以访问部署的三个模型了INFO: Started server process [214508] INFO: Waiting for application startup. ██╗ ██╗████████╗███████╗██╗ ██╗ ███╗ ███╗ ██║ ██║╚══██╔══╝██╔════╝██║ ██║ ████╗ ████║ ██║ ██║ ██║ █████╗ ██║ ██║ ██╔████╔██║ ██║ ██║ ██║ ██╔══╝ ██║ ██║ ██║╚██╔╝██║ ███████╗██║ ██║ ███████╗███████╗███████╗██║ ╚═╝ ██║ ╚══════╝╚═╝ ╚═╝ ╚══════╝╚══════╝╚══════╝╚═╝ ╚═╝ Thank you for using LiteLLM! - Krrish Ishaan LiteLLM: Proxy initialized with Config, Set models: Qwen/Qwen3.5-4B Qwen/Qwen3.5-2B Qwen/Qwen3.5-9B INFO: Application startup complete. INFO: Uvicorn running on http://0.0.0.0:8088 (Press CTRLC to quit)

相关新闻

全栈开发必备！一站式编程工具聚合页，告别到处搜在线工具

Beyond Compare 5 激活指南：3分钟搞定许可生成与注册

月薪3万的AI运营岗，简历写这3个项目经验，直接拿下大厂Offer

碧蓝航线Live2D模型提取终极指南：从游戏文件到可编辑资源

如何用Mermaid Live Editor实现5分钟完成复杂图表设计？

美光与Anthropic签署AI内存供应协议并投资H轮融资

7分钟高效掌握：为什么DLSS Swapper能彻底解决游戏画质升级难题

开放式耳机品牌有哪些？盘点热门的开放式耳机品牌排行榜前十名

2026论文必藏降AI率工具大曝光：一键改写直达人工原创！

计算机毕业设计之基于Java的流浪动物收养系统设计与开发

暗黑2存档编辑器终极指南：5分钟快速掌握d2s-editor完整使用教程

【Netty源码解读和权威指南】第54篇：Netty在Elasticsearch中的应用——分布式搜索引擎的网络通信

3个步骤让小爱音箱变身AI语音助手：MiGPT深度体验指南

【人工智能】一文搞定到底什么是智能体

嵌入式GUI开发实战：emWin控件API解析与避坑指南

从陌生到熟悉：Royal TSX中文汉化包的体验地图之旅

时延最优化设计

别再重启了！Windows 11下dwm.exe内存飙升，我用Intel官方工具升级显卡驱动搞定