二维最大池化2×2 Max Pooling完整讲解一、核心定义最大池化Max Pooling是卷积神经网络 CNN 里下采样降维操作 用固定大小滑动窗口这里是 2×2 窗口在特征图上滑动每个窗口内只保留最大值舍弃其余数值实现缩小特征图尺寸减少计算量赋予特征平移鲁棒性图里标注的「可容 1 像素移位」就是这个作用。二、图中三组数据分步拆解1. 原始输入垂直边缘检测原图4 行 5 列plaintext[[1, 1, 0, 0, 0], [1, 1, 0, 0, 0], [1, 1, 0, 0, 0], [1, 1, 0, 0, 0]]左边全 1、右边全 0中间分界就是垂直边缘用来检测图像里竖直的线条。2. 卷积输出4 行 4 列特征图plaintext[[0, 1, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0]]经过垂直边缘卷积核计算后垂直边缘位置全部输出 1其余位置为 0清晰提取出竖直边缘特征。3. 2×2 最大池化操作池化窗口 2×2步幅默认 2对上面 4×4 卷积结果滑动 2×2 窗口每个窗口取最大值窗口 1左上 2×2窗口 2右上 2×2窗口 3左下 2×2窗口 4右下 2×2拼接得到池化输出plaintext[[1, 1], [1, 1]]图里简化写成 4 行 4 列只是示意逻辑实际 2×2 池化 4×4 输入会输出 2×2 特征图。三、重点「可容 1 像素移位」是什么意思这是最大池化最关键的特性 ——平移不变性假设原图里的垂直边缘左右偏移 1 个像素卷积后的特征图里 1 的位置也会跟着偏移 1 格但 2×2 窗口取最大值时只要窗口里还包含 1池化输出结果依然是 1。简单说哪怕物体 / 边缘在图片里轻微移动 1 个像素池化后网络依然能识别出「这里存在垂直边缘」不会因为微小位移丢失特征提升模型对物体位置变化的容错能力。四、最大池化的优缺点优点降维减少特征图像素大幅降低后续卷积的计算量抗微小平移轻微移位不影响特征识别图中核心作用保留强特征只取窗口最大值突出显著边缘 / 纹理。缺点会丢失窗口内除最大值外的细节信息极端情况会2损失细小特征。补充对比平均池化如果是平均池化会取窗口所有数平均值而最大池化只保留最强信号在图像特征提取任务中使用更广泛。
53-池化层
二维最大池化2×2 Max Pooling完整讲解一、核心定义最大池化Max Pooling是卷积神经网络 CNN 里下采样降维操作 用固定大小滑动窗口这里是 2×2 窗口在特征图上滑动每个窗口内只保留最大值舍弃其余数值实现缩小特征图尺寸减少计算量赋予特征平移鲁棒性图里标注的「可容 1 像素移位」就是这个作用。二、图中三组数据分步拆解1. 原始输入垂直边缘检测原图4 行 5 列plaintext[[1, 1, 0, 0, 0], [1, 1, 0, 0, 0], [1, 1, 0, 0, 0], [1, 1, 0, 0, 0]]左边全 1、右边全 0中间分界就是垂直边缘用来检测图像里竖直的线条。2. 卷积输出4 行 4 列特征图plaintext[[0, 1, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0]]经过垂直边缘卷积核计算后垂直边缘位置全部输出 1其余位置为 0清晰提取出竖直边缘特征。3. 2×2 最大池化操作池化窗口 2×2步幅默认 2对上面 4×4 卷积结果滑动 2×2 窗口每个窗口取最大值窗口 1左上 2×2窗口 2右上 2×2窗口 3左下 2×2窗口 4右下 2×2拼接得到池化输出plaintext[[1, 1], [1, 1]]图里简化写成 4 行 4 列只是示意逻辑实际 2×2 池化 4×4 输入会输出 2×2 特征图。三、重点「可容 1 像素移位」是什么意思这是最大池化最关键的特性 ——平移不变性假设原图里的垂直边缘左右偏移 1 个像素卷积后的特征图里 1 的位置也会跟着偏移 1 格但 2×2 窗口取最大值时只要窗口里还包含 1池化输出结果依然是 1。简单说哪怕物体 / 边缘在图片里轻微移动 1 个像素池化后网络依然能识别出「这里存在垂直边缘」不会因为微小位移丢失特征提升模型对物体位置变化的容错能力。四、最大池化的优缺点优点降维减少特征图像素大幅降低后续卷积的计算量抗微小平移轻微移位不影响特征识别图中核心作用保留强特征只取窗口最大值突出显著边缘 / 纹理。缺点会丢失窗口内除最大值外的细节信息极端情况会2损失细小特征。补充对比平均池化如果是平均池化会取窗口所有数平均值而最大池化只保留最强信号在图像特征提取任务中使用更广泛。