使用 ray 调整 sklearn 中的超参数

问题描述

我想知道但找不到任何信息，如果我尝试使用 TunesearchCV 调整 sklearn 中的超参数，为什么会一直出现这种情况：

请注意，重要的部分是日志同步警告，因此与 tensorflow 和 search_optimization（例如 optuna）结合使用的日志记录不起作用：

Backend is sklearn
Concatenating h5 datasets of the following files: 
('output/example_train_1.h5','output/example_train_2.h5') 
based on the following keys: 
('x','y')
Concatenation successful,resulting shapes for the given dsets:
Key: x,shape: (20000,25)
Key: y,)
Log sync requires rsync to be installed.

Process finished with exit code 0

只要我不使用诸如可选之类的搜索优化，调整过程似乎都在起作用。我在 docker 容器中使用它。我通过了 ray-documentation，但我可以找到我认为错误下降的来源。但是，我找不到有关如何阻止它的任何设置或其他选项。

此外，如果我使用集群，似乎只需要 rsync。但实际上，我现在不这样做。

解决方法

警告 (time_to_live) 不会阻止脚本执行。如果未安装 rsync，它将不会在节点之间同步日志，这在您的情况下似乎是不必要的。你不应该在那里遇到任何问题。

很难说这里的问题是什么，因为我们缺少关键信息：您运行的是哪个版本的 Ray，哪个版本的 tune-sklearn，以及您的训练脚本是什么样的？

如果您遇到问题并且怀疑它是一个错误，请考虑在 tune-sklearn repository 中打开一个问题，并确保包含上述信息，最好包含一个最小的可重现脚本，以便维护人员可以查看进入这个。

ray scikit-learn