遥感图像分类领域的混淆矩阵

混淆矩阵是分类精度的评定指标。

对检核分类精度的样区内所有的像元,统计其分类图中的类别与实际类别之间的混淆程度。

混淆矩阵中,对角线上元素为被正确分类的样本数目,非对角线上的元素为错分的样本数。

名字 解释
生产者(制图) 精度 地表真实为A类,分类图像的像元归为A的概率
用户精度 假定分类器将像元归到A类时,地表真实类别是A的概率
总体分类精度 等于被正确分类的像元总和除以总像元数,地表真实图像或地表真实感兴趣区限定了像元的真实分类。被正确分类的像元沿着混淆矩阵的对角线分布,它显示出被分类到正确地表真实分类中的像元数。像元总数等于所有地表真实分类中的像元总和。
Kappa系数 所有地表真实分类中的像元总数(N) 乘以混淆矩阵对角线(Xkk) 的和,再减去某一类中地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果,再除以总像元数的平方差减去某一类中地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果所得到的。

我知道看上面的文字看起来特烧脑,下面我们一起来看个例子:
在这里插入图片描述
对这个例子的通俗描述(有可能不太准确)为:我们在实际地物上共取了 650 个像素点:有137个像素点属于类别1、有130个像素点属于类别2、有134个像素点属于类别3、有123个像素点属于类别4、有126个像素点属于类别5;但是呢,实验过程中分的太均匀了,给每一类都分到了130个像素点。

ok,分类完成了,怎样衡量这次分类实验的精度呢?前辈么就提出了四个量:生产者(制图) 精度、用户精度、总体分类精度、Kappa系数。看它们的字面意思不太好理解,那么我们可以这样记:生产精度可以衡量漏分误差,用户精度可以衡量多分误差(简称:生漏用多,越用越多)


为啥这样叫呢?我谈谈我的理解:

我们左下角那个137,它代表我们选取的像素点中有137个属于类别1,但是实际上呢,这137个像素点中只有100个被正确地分到了类别1,其他的都被漏掉了,这不是漏分是啥?

我们再看右上角那个130,它代表这次分类实验中有130个像素点被分到了类别1,但是呢?这130个像素点中,只有100个是真正属于类别1的,其他的都被多分到类别1了。

至于总体分类精度就是 被正确分类的像素点之和占总共像素点的比例。

kappa 系数这玩意描述起来着实酸爽,还是看看公式好了,公式也不难。


Kappa系数是用于测定两幅图像之间的吻合度或精度的指标;
Kappa系数和总体精度的区别在于:总体精度只考虑了位于对角线上的像素数量,Kappa系数既考虑了对角线上被正确分类的像素,又考虑了不在对角线上的各种漏分和错分错误。

Kappa系数 分类质量
<0.00 很差
0.00~0.20
0.20~0.40 一般
0.40~0.60
0.60~0.80 很好
0.80~1.00 极好

PS:最近看了好几篇论文,在进行遥感影像分类精度评估的时候都用到了混淆矩阵,足以说明其在遥感分类界的地位,故写这篇博客来详细介绍一下。