Detect points that are very scattered from the rest of the data
我有一组结果(数字),我想知道与以前的结果(仅以前的结果)相比,给定的结果是否非常好/差。
每一个结果都是一个数字,单位为欧元。例如,如果您有序列
。
描述这个问题的一个更一般的方法是:如何确定给定数据集中的一个点是否与其他数据分散开来。
现在,这看起来像是一个峰值检测问题,但是由于以前的值不是恒定的,所以有很多小的峰值,我只想要大的。
我的第一个想法是计算平均值并确定标准偏差,但这是非常有限的。事实上,如果在先前的结果中有一个大/小的值,它将显著地改变平均/视距偏差,并且下一个结果将必须更大/更低才能超过标准偏差(以便被检测),因此许多点将无法(正确地)被检测到。
我很肯定那一定是个众所周知的问题。
有人能帮我吗?
这种问题称为异常检测。