如何将 pandas.Dataframe 添加到作为 test_data 创建的文件中?

问题描述

我像这样将训练数据和测试数据分开用于机器学习

train_df,test_df = train_test_split(df,test_size=0.2,random_state=42)

现在我想将每个数据保存到“train_data”和“test_data”文件中 可以像“./train_data”或“./test_data”这样访问

但我不知道怎么做。我发现有“to_csv”,但我认为不是因为这个 当我这样做

test_df.to_csv('./test_data')

我收到错误说 IsADirectoryError: [Errno 21] Is a directory: './test_data'。 我该怎么办?

解决方法

import pandas as pd
from sklearn.model_selection import train_test_split

#creating your dataframe
df = ...

train_data,test_data = train_test_split(df,test_size=0.2,random_state=42)

train_data.to_csv(open('train_data.csv','w'))
test_data.to_csv(open('test_data.csv','w'))
#you can optionally add an encoding,on my machine I always use encoding="utf-8"