Tensorflow2.4、model_main_tf2.py、训练时的chechpoint问题

问题描述

我按照 Gilbert Tunner 教程使用 Tensorflow 2 进行对象检测,但在使用 model_main_ft2.py 进行训练时出现此错误

回溯(最近一次调用最后一次):

文件“model_main_tf2.py”,第 113 行,在 tf.compat.v1.app.run() 文件“C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\platform\app.py”, 第 40 行,运行中 _run(main=main,argv=argv,flags_parser=_parse_flags_tolerate_undef) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\absl\app.py",第 300 行,运行中 _run_main(main,args) 文件“C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\absl\app.py”, 第 251 行,在 _run_main 中 sys.exit(main(argv)) 文件“model_main_tf2.py”,第 110 行,在 main record_summaries=FLAGS.record_summaries) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\object_detection\model_lib_v2.py",第 566 行,在 train_loop 中 unpad_groundtruth_tensors) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\object_detection\model_lib_v2.py",第 339 行,在 load_fine_tune_checkpoint 如果不是 is_object_based_checkpoint(checkpoint_path):文件“C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\object_detection\model_lib_v2.py”, 第 302 行,在 is_object_based_checkpoint 中 var_names = [var[0] for var in tf.train.list_variables(checkpoint_path)] 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\training\checkpoint_utils.py",第 112 行,在 list_variables 中 reader = load_checkpoint(ckpt_dir_or_file) 文件“C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\training\checkpoint_utils.py”, 第 67 行,在 load_checkpoint 返回 py_checkpoint_reader.NewCheckpointReader(filename) 文件“C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\training\py_checkpoint_reader.py”, 第 99 行,在 NewCheckpointReader 中 error_translator(e) 文件“C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\training\py_checkpoint_reader.py”, 第 35 行,在 error_translator 中 引发 errors_impl.NotFoundError(None,None,error_message) tensorflow.python.framework.errors_impl.NotFoundError:不成功 TensorSliceReader 构造函数:找不到任何匹配的文件 C:/Users/Desktop/Tutorial/models/research/object_detection/efficientdet_d0_coco17_tpu-32/chechpoint/ckpt-0

我在对象检测文件夹中创建了 efficientdet_d0_coco17_tpu-32 文件夹,下载并解压了我的模型。我已经修改了训练文件夹中的模型,添加一个检查点路径。

解决方法

来自评论

错误是大小超过 efficentdetd0 大小请求的图像(从 dons21 转述)