宏平均Macro-average宏平均计算每个类别的评价指标如准确率、精确率、召回率、F1 分数等然后对所有类别的指标进行平均。宏平均给予每个类别相同的权重适用于各个类别的重要性相等的情况。宏平均不会因为类别样本数量不同而偏向样本较多的类别。它关注每个类别的表现适用于各个类别的重要性相等或相近的情况。微平均Micro-average微平均将所有类别的预测结果汇总起来计算整体的评价指标。对所有类别的预测结果进行统一的计算适用于类别样本不平衡的情况。以精确率为例微平均的精确率为其中TP 表示真正例True PositiveFN 表示假负例False Negative。微平均考虑了所有类别的样本数量它会更关注样本数量多的类别因为这些类别会对整体性能有更大的影响。微平均能够反映出模型在处理样本数量不平衡情况下的表现。加权平均Weighted Average加权平均考虑了类别样本数量的不平衡性对每个类别的指标乘以对应类别的样本数量占总样本数量的比例然后进行加权平均。这可以反映不同类别的重要性。加权平均考虑了类别样本数量的不平衡性对样本较多的类别给予更大的权重从而更好地反映整体性能。它适用于类别样本数量差异较大的情况。
机器学习评价指标之平均概念
宏平均Macro-average宏平均计算每个类别的评价指标如准确率、精确率、召回率、F1 分数等然后对所有类别的指标进行平均。宏平均给予每个类别相同的权重适用于各个类别的重要性相等的情况。宏平均不会因为类别样本数量不同而偏向样本较多的类别。它关注每个类别的表现适用于各个类别的重要性相等或相近的情况。微平均Micro-average微平均将所有类别的预测结果汇总起来计算整体的评价指标。对所有类别的预测结果进行统一的计算适用于类别样本不平衡的情况。以精确率为例微平均的精确率为其中TP 表示真正例True PositiveFN 表示假负例False Negative。微平均考虑了所有类别的样本数量它会更关注样本数量多的类别因为这些类别会对整体性能有更大的影响。微平均能够反映出模型在处理样本数量不平衡情况下的表现。加权平均Weighted Average加权平均考虑了类别样本数量的不平衡性对每个类别的指标乘以对应类别的样本数量占总样本数量的比例然后进行加权平均。这可以反映不同类别的重要性。加权平均考虑了类别样本数量的不平衡性对样本较多的类别给予更大的权重从而更好地反映整体性能。它适用于类别样本数量差异较大的情况。