如何在交叉验证中使用.fit

问题描述

我对数据科学还很陌生,有点困惑。 并且只是想确保我的方法有意义。

我创建如下模型:

lr7 = GaussianNB().fit(X_train,y_train)

,然后紧接着使用cross_val_predict()。

y_pred8 = cross_val_predict(lr8,X_test,y_test,cv=5,n_jobs=-1,verbose=5)

首先交叉验证火车组是否更有意义?

scikitlearn中还有一个cross_validate()功能。 将此与火车数据集一起使用是否正确?在文档中,他们同时使用X和y,而不训练/测试分割后的数据。

解决方法

实现交叉验证的一种简单方法是使用cross_val_score函数(来自sklearn。这可能适合您的问题。

# build model
lr7 = GaussianNB()
scores = cross_val_score(lr7,X,y,cv=5)

请注意,在交叉验证中,您可以使用整个数据集,也可以使用训练部分X_trainy_train,而不使用代码中显示的测试部分。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...