问题描述
我像这样将训练数据和测试数据分开用于机器学习
train_df,test_df = train_test_split(df,test_size=0.2,random_state=42)
现在我想将每个数据保存到“train_data”和“test_data”文件中 可以像“./train_data”或“./test_data”这样访问
但我不知道怎么做。我发现有“to_csv”,但我认为不是因为这个 当我这样做
test_df.to_csv('./test_data')
我收到错误说 IsADirectoryError: [Errno 21] Is a directory: './test_data'。 我该怎么办?
解决方法
import pandas as pd
from sklearn.model_selection import train_test_split
#creating your dataframe
df = ...
train_data,test_data = train_test_split(df,test_size=0.2,random_state=42)
train_data.to_csv(open('train_data.csv','w'))
test_data.to_csv(open('test_data.csv','w'))
#you can optionally add an encoding,on my machine I always use encoding="utf-8"