导读高速列车轴承智能故障诊断是保障轨道交通运营安全的关键技术。随着我国“八纵八横”高铁网络的快速扩展列车运行密度持续加大轴承故障预警面临新的挑战一方面台架实验数据与真实运行数据存在显著分布差异另一方面故障样本稀缺导致传统深度学习模型泛化能力不足。在此背景下迁移学习为解决这类问题提供了有效的路径。本文提出一种基于特征选择与机器学习的跨工况故障诊断方法。针对源域中正常样本极少的类别不平衡问题采用SMOTE过采样增加样本。在此基础上对比了随机森林重要性排序、递归特征消除(RFE)和自编码器三种特征选择方法并结合随机森林、支持向量机与多层感知机(MLP)三种分类器进行性能评估。实验结果表明RFE-20特征子集与MLP的组合在源域验证集上取得最佳性能准确率达95.16%。使用该最佳模型对16个无标签的目标域样本进行预测93.8%的样本预测置信度超过0.9预测类别涵盖内圈、外圈、滚动体故障及正常状态。作者信息胡闽珊, 郑菲菲重庆理工大学数学科学学院重庆论文详情数据预处理与分析本文以 161 个具有代表性的轴承试验台架振动数据文件作为问题研究的源域数据集和另外给出来自实际的 16 个轴承故障文件作为目标域数据集数据来源于 2025 年“华为杯”中国研究生数学建模竞赛 E 题官方提供的“高速列车轴承智能故障诊断”数据集。正常与故障轴承的振动信号特征区分明显。正常状态振动平稳、幅值较小而三种故障状态均表现 为振幅增大和冲击特征且其冲击的频率、强度与规律各不相同下图 Normal Fault 表示正常状态、Inner Race Fault 表示内圈故障、Outer Race Fault 表示外圈故障、Ball Fault 表示滚动体故障。如图 2 展示了不同轴承健康状态下的时域波形对比正常状态无明显周期性冲击振动平稳随机。其余三种故障有周期性的冲击振动幅度不均其中滚动体故障振动特征最为复杂。如图 3、图 4 所示带通滤 在 RMSE 和 SNR 指标上均优于小波去噪平均 RMSE 为 0.0505仅为小波去噪(0.1523)的约 1/3。在传统方法中信号处理是后续特征提取及故障分类的基础本文从时域、频域、包络谱、时频域四 个维度对轴承振动信号进行全方位特征提取涵盖多类典型指标。特征选择的结果见表 1。模型预测分析训练支持向量机分类模型的参数如表 2 所示表 3 为 SVM 模型在不同特征选择方法下的关键性能指标表格。SVM 在三种特征选择方法(随机森林(RF-22)、递归消除法(REF-20)、自编码器(AE-12))中随机森林(RF-22)效果最好。表 4 为是 MLP 模型在不同特征选择方法下的关键性能指标表格。随机森林模型的参数如表 5 所示表 6 为是 SVM 模型在不同特征选择方法下的关键性能指标表格。最终选择递归消除–多层感知机模型(Recursive Feature Elimination-Multi-Layer Perceptron以多层感知机(MLP)模型)且采用递归消除法进行特征选择。原始特征的平均准确率为 93.55%采用递归特征消除(RFE)筛选后的 22 维特征的平均准确率为 95.16%这说明在降低特征维度的同时实现了性能优化证明 RFE 能有效剔除冗余特征提取具有强判别性的故障信息。基于 16 个目标域滚动体故障样本采用经 RFE 特征选择优化后的 MLP 模型进行故障诊断预测结果整体表现优异。模型在目标域上的预测置信度分布呈现出显著的高置信度集中特征具体统计结果如 表 7 和图 7 预测置信度分布饼图所示。总结与讨论本文针对高速列车滚动轴承跨工况故障诊断中源域与目标域数据分布偏移的问题构建了一套递归特 征消除(RFE)优化的多层感知机(MLP)故障诊断模型。通过源域与目标域的多组对比实验在源域验证集上取得 95.16%的准确率并在 16 个无标签的目标域样本上获得了 93.8%的高置信度预测。验证了所提方法的有效性与可靠性。但是本文所用的目标域的数量只有 16 个缺乏大量样本。且 RFE 特征选择过程需要迭代训练模型计算成本相对较高。未来可以扩充目标域的样本提升评估的统计意义结合更高效的特征筛选方法进一步提升模型的整体效率。原文链接https://doi.org/10.12677/csa.2026.166216
【计算机科学与应用】基于迁移学习的滚动轴承故障诊断方法研究
导读高速列车轴承智能故障诊断是保障轨道交通运营安全的关键技术。随着我国“八纵八横”高铁网络的快速扩展列车运行密度持续加大轴承故障预警面临新的挑战一方面台架实验数据与真实运行数据存在显著分布差异另一方面故障样本稀缺导致传统深度学习模型泛化能力不足。在此背景下迁移学习为解决这类问题提供了有效的路径。本文提出一种基于特征选择与机器学习的跨工况故障诊断方法。针对源域中正常样本极少的类别不平衡问题采用SMOTE过采样增加样本。在此基础上对比了随机森林重要性排序、递归特征消除(RFE)和自编码器三种特征选择方法并结合随机森林、支持向量机与多层感知机(MLP)三种分类器进行性能评估。实验结果表明RFE-20特征子集与MLP的组合在源域验证集上取得最佳性能准确率达95.16%。使用该最佳模型对16个无标签的目标域样本进行预测93.8%的样本预测置信度超过0.9预测类别涵盖内圈、外圈、滚动体故障及正常状态。作者信息胡闽珊, 郑菲菲重庆理工大学数学科学学院重庆论文详情数据预处理与分析本文以 161 个具有代表性的轴承试验台架振动数据文件作为问题研究的源域数据集和另外给出来自实际的 16 个轴承故障文件作为目标域数据集数据来源于 2025 年“华为杯”中国研究生数学建模竞赛 E 题官方提供的“高速列车轴承智能故障诊断”数据集。正常与故障轴承的振动信号特征区分明显。正常状态振动平稳、幅值较小而三种故障状态均表现 为振幅增大和冲击特征且其冲击的频率、强度与规律各不相同下图 Normal Fault 表示正常状态、Inner Race Fault 表示内圈故障、Outer Race Fault 表示外圈故障、Ball Fault 表示滚动体故障。如图 2 展示了不同轴承健康状态下的时域波形对比正常状态无明显周期性冲击振动平稳随机。其余三种故障有周期性的冲击振动幅度不均其中滚动体故障振动特征最为复杂。如图 3、图 4 所示带通滤 在 RMSE 和 SNR 指标上均优于小波去噪平均 RMSE 为 0.0505仅为小波去噪(0.1523)的约 1/3。在传统方法中信号处理是后续特征提取及故障分类的基础本文从时域、频域、包络谱、时频域四 个维度对轴承振动信号进行全方位特征提取涵盖多类典型指标。特征选择的结果见表 1。模型预测分析训练支持向量机分类模型的参数如表 2 所示表 3 为 SVM 模型在不同特征选择方法下的关键性能指标表格。SVM 在三种特征选择方法(随机森林(RF-22)、递归消除法(REF-20)、自编码器(AE-12))中随机森林(RF-22)效果最好。表 4 为是 MLP 模型在不同特征选择方法下的关键性能指标表格。随机森林模型的参数如表 5 所示表 6 为是 SVM 模型在不同特征选择方法下的关键性能指标表格。最终选择递归消除–多层感知机模型(Recursive Feature Elimination-Multi-Layer Perceptron以多层感知机(MLP)模型)且采用递归消除法进行特征选择。原始特征的平均准确率为 93.55%采用递归特征消除(RFE)筛选后的 22 维特征的平均准确率为 95.16%这说明在降低特征维度的同时实现了性能优化证明 RFE 能有效剔除冗余特征提取具有强判别性的故障信息。基于 16 个目标域滚动体故障样本采用经 RFE 特征选择优化后的 MLP 模型进行故障诊断预测结果整体表现优异。模型在目标域上的预测置信度分布呈现出显著的高置信度集中特征具体统计结果如 表 7 和图 7 预测置信度分布饼图所示。总结与讨论本文针对高速列车滚动轴承跨工况故障诊断中源域与目标域数据分布偏移的问题构建了一套递归特 征消除(RFE)优化的多层感知机(MLP)故障诊断模型。通过源域与目标域的多组对比实验在源域验证集上取得 95.16%的准确率并在 16 个无标签的目标域样本上获得了 93.8%的高置信度预测。验证了所提方法的有效性与可靠性。但是本文所用的目标域的数量只有 16 个缺乏大量样本。且 RFE 特征选择过程需要迭代训练模型计算成本相对较高。未来可以扩充目标域的样本提升评估的统计意义结合更高效的特征筛选方法进一步提升模型的整体效率。原文链接https://doi.org/10.12677/csa.2026.166216