别再手动删了!用Notepad++正则表达式5分钟批量清理课程目录(附实战案例)

别再手动删了!用Notepad++正则表达式5分钟批量清理课程目录(附实战案例) 5分钟极简正则表达式实战用Notepad智能清洗杂乱课程目录每次整理网课资源时最头疼的莫过于面对几十个类似03_Python基础--循环结构实战.mp4这样的文件名。手动一个个删除序号和分类不仅耗时还容易出错。上周帮同事整理200多份培训视频时发现用Notepad的正则表达式替换功能配合几个关键符号组合5分钟就能完成原本需要两小时的工作量。1. 从混乱到有序文件命名规范化实战假设我们有一批从在线教育平台下载的课程文件命名格式通常包含三部分冗余信息课程序号如01_、02_课程分类如Java入门、Python基础分隔符号如--、_原始文件名示例01_Java入门--变量与数据类型.mp4 02_Java进阶--面向对象编程.mp4 03_Python基础--条件判断语句.mp4期望处理后效果变量与数据类型.mp4 面向对象编程.mp4 条件判断语句.mp4关键问题拆解需要保留--之后的内容需要删除--之前的所有字符包括数字、下划线、中文等需要处理不同分隔符情况如_替换为空格提示Notepad的查找替换窗口快捷键是CtrlH记得勾选正则表达式选项2. 正则表达式核心匹配策略针对--分隔符场景我们需要构建匹配--前所有内容的模式。这里介绍两种等效方案方案A匹配非--字符序列^.*?--^匹配行首.*?非贪婪模式匹配任意字符直到遇到----匹配分隔符本身方案B否定字符集方案^[^--]--[^--]匹配任何非--的字符匹配一次或多次替换框留空即可删除匹配内容。两种方案效果相同但方案B在大文件处理时效率更高。操作步骤打开Notepad粘贴或打开包含文件名的文本CtrlH打开替换窗口在查找内容输入方案A或B的表达式替换为留空勾选正则表达式点击全部替换3. 进阶技巧处理多分隔符场景实际工作中常会遇到不同分隔符混合的情况。通过调整正则表达式我们可以一次性处理多种分隔模式案例1下划线分隔转空格原始文本01_Java入门_变量与数据类型.mp4目标格式Java入门 变量与数据类型.mp4解决方案^\d_|_(?[^_]\.mp4$)替换为单个空格案例2多级目录清洗原始文本[IT课程]/01_Python/03_数据分析--Pandas实战.mp4目标格式Pandas实战.mp4复合表达式^.*?/.*?--|^\d_4. 避坑指南与效率优化常见问题排查表现象原因解决方案替换后文件名粘连忘记添加空格在替换框输入单个空格部分内容未被替换分隔符不一致先用CtrlF检查所有分隔符文件扩展名丢失表达式包含.使用\.转义点号处理速度慢表达式过于复杂改用[^--]--简化表达式性能优化技巧超过1000行文本时先备份原文件复杂替换建议分步进行第一步去除序号^\d_第二步处理主分隔符.*?--使用.*?非贪婪模式避免意外匹配# 分步操作示例 第一次替换^\d_ → 留空 第二次替换.*?-- → 留空5. 正则表达式模式库针对常见课程目录清洗场景推荐收藏这些即用型表达式场景正则表达式替换为去除方括号内容[.*?]留空删除视频分辨率\d{3,4}[x×]\d{3,4}留空提取章节号^第([一二三四五六七八九十])章第$1章中英文间加空格([一-龥])([a-zA-Z])$1 $2对于需要保留部分内容的场景可以使用捕获组^.*?--(.*)$替换为$1这个表达式将--后的所有内容保存到$1分组替换时仅保留该部分。当需要调整最终格式时这种方法比简单删除更灵活。