LlamaFactory WebUI 零代码微调:用 Qwen3.5-4B 训练专属模型,笔记本搞定

LlamaFactory WebUI 零代码微调:用 Qwen3.5-4B 训练专属模型,笔记本搞定 前几天Unsloth Studio那篇发出来留言区有人问「那 LlamaFactory 呢我之前装过 LlamaFactory到底哪个好」行今天就把 LlamaFactory WebUI 也跑一遍用同一个模型、同一份数据、同一台显卡做一次「同条件对照实验」让你能直接对着两个工具选。结论先放这里想快速跑通 显存吃紧→ 上次的 Unsloth Studio想要训练方法更多DPO / RLHF / 全参 模型覆盖更广→ LlamaFactory完全新手→ Unsloth Studio 上手更友好下面把安装、跑通、对比拆给你。一、LlamaFactory 是什么GitHub 上 hiyouga 维护的开源项目30K star是中文社区最活跃的微调框架之一。核心优势微调方法最全LoRA / QLoRA / 全量微调 / Freeze / DPO / RLHF / PPO 都内置模型支持最多Qwen 全系、Llama 全系、Gemma、DeepSeek、ChatGLM、Yi、Baichuan…官方 README 列了 100 个WebUI 参数更彻底Gradio 界面几乎所有训练参数都暴露在前端中文社区氛围好作者就是中国人issue 区中文问答活跃相对 Unsloth Studio 的劣势安装比 Unsloth 重第一次 pip 会装下来 4GB 依赖显存优化没那么极致同样 Qwen3.5-4B 4-bit QLoRA我实测多吃 1-2GB界面新手向度略低参数太多第一次打开容易眼花二、安装git clone https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factorypip install -e .[torch,metrics]⚠️ 跑这条命令前确认 PyTorch 和 CUDA 版本匹配。我 RTX 4060 笔记本 CUDA 12.4装torch 2.5.1cu124无报错。启动 WebUIllamafactory-cli webui默认在http://localhost:7860起一个 Gradio 界面。首次加载会拉一次模型清单等 10 秒左右。⚠️ 国内访问 HuggingFace 慢的同学先设环境变量再启动export HF_ENDPOINThttps://hf-mirror.com不然第 1 步选模型时会卡在下载。三、5 步跑通同款客服微调为了能直接和上次 Unsloth Studio 那篇对比我刻意用完全相同的条件模型Qwen3.5-4B数据同一份 500 条客服对话 JSONL显卡RTX 4060 8GB第 1 步选模型WebUI 顶部就是「模型名称」下拉搜 Qwen3.5选Qwen3.5-4B-Instruct。下面「微调方法」选LoRA。QLoRA 不是直接选项而是在右下「量化等级」里选4-bit。第 2 步数据集LlamaFactory 的数据集要先在data/dataset_info.json里登记一行my_kefu: { file_name: kefu_500.jsonl, columns: {prompt: instruction, response: output}}然后把kefu_500.jsonl丢进data/目录。WebUI「数据集」下拉里就出现my_kefu了。这一步是 LlamaFactory 比 Unsloth Studio 麻烦的地方Unsloth 直接拖文件上传LlamaFactory 要改 JSON。好处是登记一次、永久复用。第 3 步调超参LlamaFactory 的参数分了三栏新手只盯下面几个就够了参数我的设置对照 Unsloth Studio学习率2e-4一致训练轮数3一致批处理大小1一致梯度累积8一致LoRA 秩32一致截断长度4096一致量化等级4-bitQLoRA有个 LlamaFactory 独家选项叫「LoRA 作用模块」可指定 LoRA 只挂在q_proj,v_proj还是全部 attention 层。默认all新手别动。第 4 步启动 监控点「开始」。日志在下方实时滚Loss 曲线在右上「可视化」标签。我这次实测42 分钟跑完。参考上次 Unsloth Studio 同条件38 分钟。差距主要来自 Unsloth 的 Triton 内核优化确实快一点点。显存峰值7.4GBUnsloth 是 6.2GB。8GB 显存的 4060 不爆但 6GB 显存的卡就吃紧——这种情况下 Unsloth 是更稳的选择。第 5 步测试 导出LlamaFactory 训完不像 Unsloth Studio 那样在原界面直接对话。要切到「Chat」标签页加载 checkpoint 后才能测试。我问同一句「你们能不能加急发货」输出「您好加急服务需要额外付费 20 元最快 4 小时内出库……」风格和上次 Unsloth 训出来的版本几乎一致。说明同样的数据 同样的超参两个框架训出来的效果基本等价。导出在「Export」标签页可选LoRA 适配器默认合并后完整模型标准 transformers 格式GGUFLlamaFactory 不直接支持要先合并再用 llama.cpp 转要喂给 Ollama得额外加一步python -m llama_cpp.convert path/to/merged --outfile my-kefu.gguf --outtype q4_k_mollama create my-kefu -f ModelfileUnsloth Studio 这一步是一键导出 GGUF 的省事一些。四、横向对比表维度Unsloth StudioLlamaFactory WebUI安装难度⭐⭐⭐⭐⭐ 一行 pip⭐⭐⭐⭐ 装得稍久上手友好度⭐⭐⭐⭐⭐ 默认推荐配置⭐⭐⭐ 参数多显存优化⭐⭐⭐⭐⭐ 4BQLoRA 6GB⭐⭐⭐⭐ 7-8GB训练速度⭐⭐⭐⭐⭐ Triton 内核⭐⭐⭐⭐ 慢 5-10%微调方法广度⭐⭐⭐ LoRA/QLoRA⭐⭐⭐⭐⭐ DPO/RLHF/全参模型支持⭐⭐⭐⭐ 30⭐⭐⭐⭐⭐ 100导出 Ollama 友好度⭐⭐⭐⭐⭐ 一键 GGUF⭐⭐⭐ 多一步转换多 GPU 训练⭐⭐⭐ 支持较弱⭐⭐⭐⭐⭐ 原生支持中文社区⭐⭐⭐ 英文为主⭐⭐⭐⭐⭐ 中文活跃五、我的判断怎么选选 Unsloth Studio8GB 显存以下的笔记本完全新手只想跑通一次微调想最快出 GGUF 给 Ollama 用目标就是 LoRA 风格化 / 领域问答选 LlamaFactory显存 12GB想试 DPO / RLHF / 全参微调等进阶方法训非 Qwen / Gemma 系的模型Yi、Baichuan、ChatGLM 等团队多卡训练卡 HuggingFace 下载会切 hf-mirror 镜像两个都装也完全可以——它们不冲突conda 各开一个环境就行。我自己现在的策略是演示给新手看用 Unsloth Studio自己做实验用 LlamaFactory。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】