使用 ray 调整 sklearn 中的超参数

问题描述

我想知道但找不到任何信息,如果我尝试使用 TunesearchCV 调整 sklearn 中的超参数,为什么会一直出现这种情况:

请注意,重要的部分是日志同步警告,因此与 tensorflow 和 search_optimization(例如 optuna)结合使用的日志记录不起作用:

Backend is sklearn
Concatenating h5 datasets of the following files: 
('output/example_train_1.h5','output/example_train_2.h5') 
based on the following keys: 
('x','y')
Concatenation successful,resulting shapes for the given dsets:
Key: x,shape: (20000,25)
Key: y,)
Log sync requires rsync to be installed.

Process finished with exit code 0

只要我不使用诸如可选之类的搜索优化,调整过程似乎都在起作用。 我在 docker 容器中使用它。我通过了 ray-documentation,但我可以找到我认为错误下降的来源。但是,我找不到有关如何阻止它的任何设置或其他选项。

此外,如果我使用集群,似乎只需要 rsync。但实际上,我现在不这样做。

解决方法

警告 (time_to_live) 不会阻止脚本执行。如果未安装 rsync,它将不会在节点之间同步日志,这在您的情况下似乎是不必要的。你不应该在那里遇到任何问题。

很难说这里的问题是什么,因为我们缺少关键信息:您运行的是哪个版本的 Ray,哪个版本的 tune-sklearn,以及您的训练脚本是什么样的?

如果您遇到问题并且怀疑它是一个错误,请考虑在 tune-sklearn repository 中打开一个问题,并确保包含上述信息,最好包含一个最小的可重现脚本,以便维护人员可以查看进入这个。