训练集准确率97%(很高),测试集准确率50%~60%(很低),解决方案探索


训练集在训练过程中,loss稳步下降,准确率上升,最后能达到97%

验证集准确率没有升高,一直维持在50%左右(二分类问题,随机概率)

测试集准确率57%

在网上搜索可能打的原因:

1.learning rate太小,陷入局部最优

2.训练集和测试集数据没有规律

3.数据噪声太大

4.数据量太小(总共1440个样本,80%为训练集)

5.训练集和测试集数据分布不同:如训练集正样本太少(训练集和测试集每次运行随机选择,故排除)

6.数据集存在问题,如标注有问题(采用公开数据集,排除)

7.学习率过大???

8.模型参数量过多而数据量过少

9.过拟合(验证集准确率没有升高过,排除)

10.输入到网络中的特征有问题,特征与label之间没有很明确的关联,或特征太少

自己猜测可能的问题:

1.正好选择了效果差的被试(脑电数据不同被试之间识别准确率有一定差距)

2.输入样本的特征向量维度太大,而数据量不够大

尝试1:增大学习率

原有学习率0.001调整为0.01

没有效果

尝试2:将特征向量进行更换