关于算法:检测从其余数据中分散的点

Detect points that are very scattered from the rest of the data

我有一组结果(数字),我想知道与以前的结果(仅以前的结果)相比,给定的结果是否非常好/差。

每一个结果都是一个数字,单位为欧元。例如,如果您有序列10, 11, 10, 9.5, 16,那么16显然是一个非常好的结果,与以前的结果相比。我想找一种算法来检测这种情况(与以前的结果相比,结果非常好/很差)。

enter image description here

描述这个问题的一个更一般的方法是:如何确定给定数据集中的一个点是否与其他数据分散开来。

现在,这看起来像是一个峰值检测问题,但是由于以前的值不是恒定的,所以有很多小的峰值,我只想要大的。

我的第一个想法是计算平均值并确定标准偏差,但这是非常有限的。事实上,如果在先前的结果中有一个大/小的值,它将显著地改变平均/视距偏差,并且下一个结果将必须更大/更低才能超过标准偏差(以便被检测),因此许多点将无法(正确地)被检测到。

我很肯定那一定是个众所周知的问题。

有人能帮我吗?


这种问题称为异常检测。