考虑提高VAE异常检测的准确性


已经提出了使用深度学习和生成模型的各种异常检测方法。
其中,我们使用了非正规化术语的异常检测方法进行了实验,该方法在2018年日本人工智能学会全国代表大会上宣布,可用于使用VAE检测复杂工业产品中的异常。

在该方法中,存在在正常部分中错误地进行异常判断的问题,具体而言,存在由于标准偏差输出层σ被低估而导致过度的异常判断的问题。
这次,我们将验证数据扩展的准确性提高效果。
(什么是数据扩展?通过对图像添加转换处理(反演,放大,缩小等),训练数据被"夸大"。通过夸大,不太可能学习相同的图像,因此将其概括化。性能得到改善。)

自我介绍

你好。
我是maharuda,ProsCons的研究实习生。

作为公司基准测试工作的一部分,我将写一篇有关VAE的文章,该文章被用作异常检测方法之一。
很高兴见到你!

目的

在尝试使用非正规化项的异常检测方法时出现的问题之一,是正常部分的错误异常判断得到改善。

使用VAE

进行异常检测

将数据X转换为潜在变量z(维数小于原始数据)的神经网络称为编码器,而将潜在变量z重构以恢复原始数据的神经网络称为解码器。训练输入数据和重建数据尽可能相似。
上面的架构称为自动编码器(AE)。
将AE的潜在变量推入概率分布的变量称为VAE。
请参考以下文章以了解详细信息。

?变体自动编码器的完整说明
(https://qiita.com/kenmatsu4/items/b029d697e9995d93aa24)

通常,使用VAE进行异常检测是通过将数据放入编码器之前的数据与通过VAE重构的数据之间的差异作为异常来检测的。

检测复杂工业产品中异常现象的有用方法

工业产品由各种元素组成。
例如,在齿轮的情况下,它是从齿轮的平面,齿部和中心的孔开始的。
频繁出现的图像元素比仅偶尔出现的图像元素具有更高的可能性。

因此,当将损失函数用作异常检测函数时,用于考虑频繁出现的图像中的异常的阈值大于仅偶尔出现的图像的阈值(在频繁出现的图像中,出现异常的图像仅表示偶尔出现),这表示它比其中的异常部分出现的频率更高。
Screenshot from 2020-03-25 17-23-20.png
图1.工业产品图像中可能性的直观说明(来自论文)

以下论文提出了一种可以消除图像所属组的复杂性和频率影响的方法。
通过使用此功能,可以检测复杂工业产品(甚至在简单零件中也有异常的对象)图像中的异常。

?通过深度生成模型使用非规范化异常对工业产品进行异常检测
(https://confit.atlas.jp/guide/event-img/jsai2018/2A1-03/public/pdf?type=in)

VAE损失功能为
Screenshot from 2020-03-25 17-24-58.png
可以表示为。 (摘自论文)

通常,此损失函数 L