Nex-N2-mini:新一代智能体思维模型,如何快速上手部署与使用

Nex-N2-mini:新一代智能体思维模型,如何快速上手部署与使用 Nex-N2-mini新一代智能体思维模型如何快速上手部署与使用【免费下载链接】Nex-N2-mini项目地址: https://ai.gitcode.com/hf_mirrors/nex-agi/Nex-N2-miniNex-N2-mini是基于Qwen3.5-35B-A3B-Base构建的新一代智能体思维模型具备强大的Agentic Thinking能力能够在真实环境中驱动复杂、长期任务提供稳定的端到端结果。作为开源项目的一部分它为开发者和企业提供了高效的本地部署和使用方案。 什么是Nex-N2-mini智能体模型Nex-N2-mini通过Agentic Thinking框架统一了推理、工具使用和环境执行能力形成了一个闭环系统包括需求理解、任务规划、代码实现、环境反馈、评估调试和持续迭代等环节。该框架包含两个核心部分Adaptive Thinking模型能够自主决定思考时机和深度简单任务快速执行关键决策深入推理Coherent Thinking在通用推理和多样化智能体任务中保持一致的推理范式确保跨任务和模态的能力稳定迁移在实际智能体工作流中Nex-N2-mini在智能体编码、深度研究、工具调用和终端执行等方面表现出色在多个权威基准测试中较上一代Nex-N1有显著提升。 本地部署步骤1️⃣ 准备环境首先需要安装定制化的sglang分支这是运行Nex系列模型的推荐服务方式# 克隆定制化的sglang分支 git clone https://gitcode.com/hf_mirrors/nex-agi/sglang.git cd sglang # 安装Python依赖包 pip install --upgrade pip pip install -e python2️⃣ 启动Nex-N2-mini服务在配备2×H100的服务器上CUDA 13.0环境使用以下命令启动服务python -m sglang.launch_server \ --model-path /path/to/your/model \ --tp 2 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer Docker部署方案如果偏好容器化部署可以使用预构建的Docker镜像nexagi/sglang:v0.5.12其中已预装定制化的sglang分支docker run --gpus all --shm-size 32g --ipchost \ -p 30000:30000 \ -v /path/to/your/model:/model \ nexagi/sglang:v0.5.12 \ python3 -m sglang.launch_server \ --model-path /model \ --tp 2 \ --host 0.0.0.0 --port 30000 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer⚙️ 推荐的采样参数为获得最佳生成质量建议使用以下采样参数temperature: 0.7top_p: 0.95top_k: 40 功能调用与推理解析启用函数调用Nex系列模型支持强大的函数调用能力启动服务器时添加--tool-call-parser qwen3_coder标志即可启用python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder启用推理解析Nex系列模型会生成明确的推理轨迹添加--reasoning-parser qwen3标志可以将推理内容与最终响应分离解析可与函数调用解析器结合使用python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder --reasoning-parser qwen3 模型性能亮点Nex-N2-mini在多个基准测试中表现优异特别在以下方面Agent任务BrowseComp 74.1分GDPval 1402分Toolathlon 33.3分编码与软件工程SWE-Bench Pro 50.2分Terminal-Bench 2.1 60.7分通用推理GPQA Diamond 82.6分IFEval 89.1分这些成绩表明Nex-N2-mini在处理实际生产力场景如OpenClaw单人公司工作流、端到端游戏开发以及Web和多模态生成时具有出色的可用性、稳健性和稳定性。 配置文件解析模型配置文件config.json包含了关键参数如hidden_size: 2048 - 隐藏层大小num_hidden_layers: 40 - 隐藏层数num_attention_heads: 16 - 注意力头数num_experts: 256 - 专家数量max_position_embeddings: 262144 - 最大位置嵌入这些参数共同决定了模型的能力和性能特征适合需要深入了解模型架构的开发者参考。 快速开始使用完成部署后您可以通过发送请求到服务器端口默认为30000来使用Nex-N2-mini模型。结合推荐的采样参数和适当的提示词设计可以充分发挥模型在代码生成、任务规划和复杂问题解决方面的优势。无论是构建智能代理、自动化开发流程还是处理需要深度推理的任务Nex-N2-mini都能提供稳定可靠的支持帮助您在实际生产力场景中取得高效成果。【免费下载链接】Nex-N2-mini项目地址: https://ai.gitcode.com/hf_mirrors/nex-agi/Nex-N2-mini创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考