模型训练:具有不同超参数的已保存模型的命名方案

问题描述

对于分类任务,我一直在尝试不同的神经网络体系结构和训练方法:改变隐藏层的数量,激活函数,批处理大小,历元,损失函数等。

有时候,我想比较不同模型的性能。经过训练/验证后,每个模型都保存在S3中,其名称表示其参数+超参数(例如'100_1000_0.5_100 _..._ 1.model')

这种命名方案很混乱,我想找到一种更好的方法来基于(超)参数保存/加载模型。一种可能的选择是为不同的参数创建嵌套文件夹(例如100-> 1000-> 0.5-> 100-> ...-> 1.model)但是,这种约定仍然很脆弱—如果我更改超参数的数量/顺序,我必须在S3中重新组织整个文件夹结构。

关于如何存储具有10-15个不同参数的网络的任何建议? (而且,是否值得存储使用不同超参数训练的同一模型的多个副本?)

解决方法

bene的建议很有帮助:将每个模型保存在一个平面目录中,并附带一个参考文件来存储用于每个训练实例的超参数。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...