问题描述
对于分类任务,我一直在尝试不同的神经网络体系结构和训练方法:改变隐藏层的数量,激活函数,批处理大小,历元,损失函数等。
有时候,我想比较不同模型的性能。经过训练/验证后,每个模型都保存在S3中,其名称表示其参数+超参数(例如'100_1000_0.5_100 _..._ 1.model')
这种命名方案很混乱,我想找到一种更好的方法来基于(超)参数保存/加载模型。一种可能的选择是为不同的参数创建嵌套文件夹(例如100-> 1000-> 0.5-> 100-> ...-> 1.model)但是,这种约定仍然很脆弱—如果我更改超参数的数量/顺序,我必须在S3中重新组织整个文件夹结构。
关于如何存储具有10-15个不同参数的网络的任何建议? (而且,是否值得存储使用不同超参数训练的同一模型的多个副本?)
解决方法
bene的建议很有帮助:将每个模型保存在一个平面目录中,并附带一个参考文件来存储用于每个训练实例的超参数。