几何学基本概念——超平面(hyperplane)

几何学基本概念——超平面(hyperplane) 在几何中超平面是将三维空间中的二维平面推广至任意维数学空间所得到的概念。正如三维空间中的平面一样超平面是一种“平坦(flat)”的超曲面(hypersurface)即它是维数比其所处的环境空间(ambient space)低一维的子空间。超平面的两个低维实例分别是平面中的一维直线以及直线上的零维点。加上前缀“超”(hyper-)以表明它虽然类似于平面但其内涵可能远不止是一个普通的二维平面。在三维几何学中我们通常将一个平面视为一个三维空间中的一个二维对象。在标准的Euclid几何中经过某已知点且垂直于某直线的平面是唯一确定的同理经过平面上某已知点且垂直于该平面的直线也是唯一确定的。我们希望将这种“直线与平面”之间的关联推广至更高维度。这正是“超平面”定义为n- 1维的原因——因为它恰好是该空间中某个 1 维子空间的正交补。最常见的情况是环境空间为n维Euclid空间在此情形下超平面即为 (n- 1) 维的“平坦子空间”(flats)每一个超平面都将该空间分割为两个半空间。关于超平面的反射是一种“运动”(即保持点间距离不变的几何变换)而所有的运动共同构成了一个群该群正是由这些反射所生成的。凸多胞形(A convex polytope)则是若干个半空间的交集。在非Euclid几何中环境空间可能是n维球面、双曲空间或者更一般地是伪Riemann空间形式此时的超平面则是由所有穿过某一点且垂直于特定法测地线的测地线所构成的超曲面。在其他类型的环境空间中Euclid空间所具备的某些性质可能不再适用。例如在仿射空间中由于不存在距离的概念因此也就无所谓反射或运动。而在像椭圆空间或射影空间这类不可定向的空间中则不存在“半空间”这一概念。从最广义的角度来看只要某个数学空间中定义了子空间的维数概念那么“超平面”这一概念在该空间中便具有其确切的意义。子空间与其环境空间之间的维数之差称为该子空间的“余维数”(codimension)。超平面的余维数恒为 1 。在计算机科学中超平面是指利用直线或平面来分隔多维空间中不同区域的一种概念。超平面通常通过方程来表示并可依据数据点相对于超平面的位置将其归入不同的类别。最优超平面是指能够最大化超平面自身与来自两个类别的最近数据点之间间隔(即“间隔”)的那个超平面。此类超平面常用于分类算法中(例如支持向量机 [SVM] 和线性回归)旨在将属于不同类别的数据点区分开来。此外它们也被应用于聚类算法中用于识别输入空间内的数据点簇。为了在分类任务中确定理想的超平面算法通常致力于最大化该超平面与各类别中距离其最近的数据点之间的“间隔”(margin)这是因为更宽阔的间隔往往能自然地构建出更为稳健且泛化能力更强的模型。超平面同样适用于回归任务此类任务的目标是预测连续的输出数值而非类别标签。在此情境下超平面代表着那条“最佳拟合线”其作用在于最小化预测值与实际值之间误差平方之和。