问题描述
在谷歌云 AI 平台训练深度学习模型时,使用超参数调优(我的超参数配置信息在 YAML 文件中),我收到此错误:
Hyperparameter Tuning Trial #2 Failed before any other successful trials were completed.
The Failed trial had parameters: batch_size=11,learning_rate=3.527059074944887e-05,.
The trial's error message was: The replica master 0 exited with a non-zero status of 1
由于错误消息有点笼统,我很难理解问题出在哪里。
我的 YAML 配置文件:
trainingInput:
hyperparameters:
goal: MINIMIZE
maxTrials: 2
maxParallelTrials: 2
hyperparameterMetricTag: loss
enableTrialEarlyStopping: FALSE
params:
- parameterName: batch_size
type: INTEGER
minValue: 8
maxValue: 16
scaleType: UNIT_LINEAR_SCALE
- parameterName: learning_rate
type: DOUBLE
minValue: 0.00001
maxValue: 0.0001
scaleType: UNIT_LINEAR_SCALE
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)