问题描述
我正在尝试创建训练数据。稍后我会标记它们。我的数据集应该看起来像
Data_Format_For_One_Item:ID|功能 1|功能2| .... |功能 N。
所有特征要么是分类的,要么是预定义范围内的整数(如 1-5 类似于分类)。有没有一种简单的方法可以创建所有变体?
解决方法
您可以使用以下代码生成这样的数据集
import pandas as pd
import numpy as np
n_rows = 500
n_cols= 20
range_start = 1
range_end = 5
dataset = pd.DataFrame(np.random.randint(range_start,range_end+1,size=(n_rows,n_cols)),columns=['col_'+str(idx+1) for idx in range(n_cols)])
演示输出