train loss 不断下降,test loss不断下降,说明网络仍在学习; train loss 不断下降,test loss趋于不变,说明网络过拟合; train loss 趋于不变,test loss不断下降,说明数据集100%有问题; train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习率或批量数目; train loss 不断上升,test loss不断上升,说明网络结构设计不当,训练超参数设置不当,数据集经过清洗等问题.
感谢 网友 Vagrant的提醒.之前 一直就看个最后的accuracy.这个应该并不靠谱.最好把说有的信息都看一下.而一个一个看.根本记不住.只能把数据读取在图片中显示一下,才比较直观. 本文就是读的cifar10中的train_quick.sh输出的txt信息. 输出txt命令类似下面: $ sh examples/mnist/train_lenet.sh 2>&1 l tee examples/mnist/文件名.txt | less 我的txt如下 I0504 16:10:30.71
画loss曲线需要用到此shell脚本 #!/bin/bash # Usage parse_log.sh caffe.log # It creates the following two text files, each containing a table: # caffe.log.test (columns: '#Iters Seconds TestAccuracy TestLoss') # caffe.log.train (columns: '#Iters Seconds Training