如何使用 sckit-learn 进行多种分类

问题描述

我正在尝试对一些数据进行分类,以提供基于观察聚类的预测。我还是个新手,一直在网上浏览示例,并在尝试使用 python 实现自己时遇到了障碍。 我有一个包含 5 列数据的文件,但我只关心 3 列如何交互。 E 列是 0=否 1= 是 我想要做的是看看 A B 和 E 之间是否存在相关性。如果 A 是 0,而 B 介于 0-15 之间,看看它是 No(0) 的可能性有多大。 当然,我的数据集比这大得多。感谢引用示例或来源。

How the data looks

我一直使用 Iris 数据集示例作为模板,但在调整时出错。 以下是我一直在使用的:

df = pd.read_csv('file.csv',)
df = pd.DataFrame (df,columns= ['A','B','C','D','E'])
df.tail()

X = df.iloc[0:50000,[0,4]].values

X[0:78209]

y = df.iloc[0:50000,4].values
y = np.where(y == 0,1)
y[0:5]
plt.scatter(X[:5000,0],X[:5000,1],alpha=0.5,c='b',edgecolors='none',label='No%2s'%(y[0]))
plt.scatter(X[5000:10000,X[5000:10000,c='r',label='Yes%2s'%(y[50]))

plt.xlabel('No')
plt.ylabel('Yes')
plt.legend(loc='lower right')

plt.show()

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)