LightGBM多变量回归区间预测(点预测 + 区间预测),MATLAB代码

LightGBM多变量回归区间预测(点预测 + 区间预测),MATLAB代码 MATLAB 代码实现了一个基于LightGBM轻量级梯度提升机的回归模型并在其基础上添加了区间预测功能即预测值附带置信区间。以下是对该代码的详细分析1. 研究背景在机器学习回归任务中通常只输出一个点预测值point prediction但在许多实际应用中如金融、能源、交通预测决策者不仅关心预测值还关心预测的不确定性即预测区间。因此研究如何在 LightGBM 模型基础上构造预测区间具有重要意义。本代码基于残差的正态性假设使用训练集残差的标准差构造 95% 置信区间实现区间预测。2. 主要功能使用 LightGBM 进行回归建模训练集和测试集的划分与归一化模型训练与早停early stopping特征重要性分析点预测 区间预测95% 置信区间多种回归评价指标计算R², MAE, MAPE, MBE, RMSE区间预测评价指标PICP, PINAW多图可视化特征重要性、损失曲线、预测区间、误差图、拟合图3. 算法步骤数据加载与预处理读取 Excel 数据按比例划分训练集/测试集默认 70% 训练归一化到 [0,1] 区间LightGBM 数据集构建使用lgbmDataset创建数据集对象设置标签字段模型参数配置使用containers.Map设置 LightGBM 参数目标函数为回归regression评估指标为 RMSE模型训练使用train函数训练模型支持早停基于验证集预测与反归一化使用predictMatrix预测反归一化得到原始尺度预测值区间构造计算训练集残差标准差 σ假设残差服从正态分布构造 95% 置信区间y^±1.96×σ \hat{y} \pm 1.96 \times \sigmay^​±1.96×σ评价指标计算回归指标R², MAE, MAPE, MBE, RMSE区间指标PICP覆盖率、PINAW宽度结果可视化特征重要性柱状图训练损失曲线带有区间填充的预测结果图相对误差条形图真实值与预测值散点拟合图4. 技术路线数据输入 → 数据划分 → 归一化 → 构建 LightGBM 数据集 → 参数设置 → 模型训练含早停 → 特征重要性分析 → 点预测 → 区间构造基于残差标准差→ 评价指标计算 → 可视化输出5. 公式原理(1) 点预测LightGBM 是基于梯度提升决策树GBDT的集成学习模型目标是最小化损失函数如均方误差L(y,y^)1n∑i1n(yi−y^i)2 L(y, \hat{y}) \frac{1}{n} \sum_{i1}^n (y_i - \hat{y}_i)^2L(y,y^​)n1​i1∑n​(yi​−y^​i​)2(2) 区间预测假设训练集残差 ( e_i y_i - \hat{y}_i ) 服从均值为 0 的正态分布则预测区间为[y^−z⋅σ, y^z⋅σ] [\hat{y} - z \cdot \sigma,\ \hat{y} z \cdot \sigma][y^​−z⋅σ,y^​z⋅σ]其中-z1.96z 1.96z1.96对应 95% 置信水平σ\sigmaσ为训练集残差的标准差(3) 区间评价指标PICPPrediction Interval Coverage ProbabilityPICP1N∑i1N1(yi∈[Li,Ui])×100% \text{PICP} \frac{1}{N} \sum_{i1}^N \mathbb{1}(y_i \in [L_i, U_i]) \times 100\%PICPN1​i1∑N​1(yi​∈[Li​,Ui​])×100%PINAWPrediction Interval Normalized Average WidthPINAW1N⋅R∑i1N(Ui−Li)×100%,Rmax⁡(y)−min⁡(y) \text{PINAW} \frac{1}{N \cdot R} \sum_{i1}^N (U_i - L_i) \times 100\%, \quad R \max(y) - \min(y)PINAWN⋅R1​i1∑N​(Ui​−Li​)×100%,Rmax(y)−min(y)6. 参数设定参数值说明num_leaves4每棵树的叶子节点数learning_rate0.95学习率偏大boosting_type‘gbdt’梯度提升决策树feature_fraction0.9每轮迭代使用的特征比例bagging_fraction0.8每轮迭代使用的样本比例bagging_freq7每 7 轮执行一次 baggingobjective‘regression’回归任务metric‘rmse’评估指标为 RMSEnum_boost_round20最大迭代次数early_stopping_rounds5早停轮数7. 运行环境操作系统Windows因为加载了.dll文件软件MATLAB需支持调用 C 库依赖LightGBM 的动态链接库lib_lightgbm.dll对应的 C 头文件c_api.hMATLAB 的loadlibrary支持8. 应用场景该代码适用于需要进行回归预测并量化不确定性的场景例如电力负荷预测股票价格区间预测交通流量预测环境监测数据预测工业设备寿命预测完整代码私信回复LightGBM多变量回归区间预测点预测 区间预测MATLAB代码