【小白笔记】 Recursive Feature Elimination（RFE）里，step 的含义-尧图企业网站定制

在 Recursive Feature EliminationRFE里step的含义是每一轮迭代删除多少特征。这个参数有两种解释方式取决于你给的是整数还是小数。代码RFE(estimatorLogisticRegression(solverliblinear,max_iter2000,class_weightbalanced,n_jobsN_JOBS,),n_features_to_select1,step0.1,)核心区别如下step值含义每轮删除特征数step10固定删除10个特征每轮删10个step0.1删除当前特征数的10%动态比例删除1️⃣step 10表示每一轮删除10个最不重要的特征。假设一开始有 200 个特征200 → 190 → 180 → 170 → ... → 10 → 1特点迭代次数少计算速度快可能跳过一些关键特征组合2️⃣step 0.1表示每轮删除当前特征数量的 10%。假设 200 个特征200 → 180 → 162 → 146 → 131 → ...特点前期删得多后期删得少更精细3️⃣ 直观对比假设 100 个特征iterationstep10step0.1start10010019090280813707346066………0.1 会越来越慢越来越精细。代码是在用Recursive Feature Elimination (RFE)配合Logistic Regression做特征选择。RFE 的核心思想是反复训练模型 → 根据特征重要性删除最不重要的特征 → 直到剩下目标数量。下面逐个解释每个参数的技术含义实际作用。1️⃣estimatorLogisticRegression(...)这是RFE 用来评估特征重要性的模型。RFE 的流程训练模型 ↓ 计算每个特征的重要性 ↓ 删除最不重要的特征 ↓ 重新训练这里用的是Logistic Regression。数学上模型为[P(y1|x)\frac{1}{1e^{-(\beta_0\beta_1x_1\dots\beta_px_p)}}]RFE 使用|β_i|作为特征重要性指标。换句话说系数越大 → 特征越重要2️⃣solverliblinear这是优化算法决定 Logistic Regression 如何求解参数。常见 solversolver特点liblinear适合小数据lbfgs默认saga支持L1/L2你的选择liblinear特点适合小样本医学数据支持L1 / L2 正则在特征选择场景非常常用对于你这种样本数 1000这是合理选择。3️⃣max_iter2000表示最大迭代次数。Logistic Regression 是通过迭代优化求解参数iteration1 iteration2 iteration3 ...默认值max_iter 100但当特征很多数据复杂可能出现ConvergenceWarning所以你设置2000目的是确保模型收敛对于你这种特征 1000这是合理的。4️⃣class_weightbalanced这是类别不平衡处理参数。如果你的数据NSTEMI : Healthy 1 : 3普通 Logistic Regression 会偏向预测 majority classbalanced的公式[w_i \frac{n_{samples}}{n_{classes} \times n_i}]例如类别样本数权重NSTEMI502Healthy1500.67作用少数类损失更大这是医学数据非常常见的设置。5️⃣n_jobsN_JOBS表示并行计算线程数。例如n_jobs -1表示使用所有CPU但需要注意liblinear 实际不支持多线程。所以n_jobs 在 liblinear 中基本不起作用如果想并行需要solversaga6️⃣n_features_to_select1这是最终保留的特征数量。RFE 过程1240 features ↓ 删除10% ↓ 1100 ↓ ... ↓ 1为什么设成1因为你可能在用RFECV 或外部循环。很多 pipeline 写法RFE → ranking ↓ 根据 ranking 选择 top-k所以设1只是为了让 RFE产生完整排序。7️⃣step0.1表示每轮删除多少特征。规则step含义step1每轮删1个step10每轮删10个step0.1每轮删10%例如1240 ↓ 1116 ↓ 1004 ↓ 903 ...优点前期降维快后期更精细这是 RFE 常用设置。8️⃣ 整个流程在你的代码中是什么样假设1240 features step 0.1RFE流程iteration1 1240 → 1116 iteration2 1116 → 1004 iteration3 1004 → 903 ...每一步训练 Logistic Regression ↓ 计算 |coef| ↓ 删除最小的一部分直到1 feature最后输出feature ranking9️⃣ RFE 输出的三个核心结果RFE训练后会得到support_ ranking_ n_features_例如feature_23 rank1 feature_91 rank2 feature_12 rank3rank1 表示最重要特征

相关新闻

经验谈：如何为你的IoT设备选择一个“靠谱”的网口？（RJ45+变压器篇）

邀请函|鲁欧智造邀您共赴SEMICON China 2026

第2集：技术选型的智慧：Flask vs FastAPI，GLM-4 vs GPT

系统分析师精简版知识点+考点

告别LED闪烁：用串口助手和printf()给你的51单片机代码做个“体检”

ComfyUI-KJNodes完整指南：如何通过5个步骤掌握AI图像生成高级节点功能

从零构建AI应用：Dify工作流与智能体实战指南

Codex ENOTFOUND 域名解析失败解决方法

Weblogic反序列化漏洞CVE-2017-10271复现与深度解析

ChatGPT到底该选哪个版本？Plus够用还是Team更划算？资深架构师用18项硬指标告诉你真相

为什么你需要Destiny 2 Solo Enabler：技术原理与实战指南

openEuler双桌面环境实战：从ukui到dde的安装与多模式切换指南

管理者的六个层次

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

38.工业通用 PLC 分拣模板！传感器去抖 + 气缸互锁 + 状态机 + 超时报警全套

从陌生到熟悉：Royal TSX中文汉化包的体验地图之旅

时延最优化设计

别再重启了！Windows 11下dwm.exe内存飙升，我用Intel官方工具升级显卡驱动搞定