问题描述
我正在使用gridsearchcv训练Logistic回归模型。日志显示:
针对1600个候选人中的每个人进行3折,总计4800次拟合
此外,对于日志中打印的以下行中的任务:
[并行(n_jobs = -1)]:完成42个任务|耗时:2.9分钟
这里的任务数量(如上述42个任务)是否与fits(= 4800)相同?
我想估计完成培训所需的时间?
解决方法
一步步破解
对 1600 个候选者中的每一个拟合 3 折,总共 4800 次拟合
- 1600 个候选意味着您正在尝试 1600 个组合
- 拟合 3 折意味着您指定了 cv=3,您正在对训练数据进行 3 次交叉验证。
- 总共 4800 次拟合 = 1600 * 3。即我们有 4800 个任务
[Parallel(n_jobs=-1)]:完成 42 个任务 |已用时间:2.9 分钟
- Parallel(n_jobs=-1),-1 表示您正在 CPU 的所有内核上运行
- 完成 42 个任务意味着 4800 个,42 个匹配已经完成
- 已用时间:2.9 分钟 - 从执行开始到完成 42 次/42 需要 2.9 分钟 > 培训
如果您还有任何疑问,请告诉我。