如何在决策树中获取新数据的labelencoder

问题描述

我正在借助以下示例数据来执行决策树。

enter image description here

因此,我已将以上数据转换为LabelEncoder以执行决策树并成功创建了DT模型。

enter image description here

所以现在我的要求是我要对以下值进行预测,以便如何在python代码中传递这些值。

enter image description here

为了预测现有值,我可以使用下面的“预测代码”。

model.predict([[2,1,1]])

完整代码

import pandas as pd

df = pd.read_csv(r"salaries.csv")
df.head()

inputs = df.drop('salary_more_then_100k',axis='columns')
target = df['salary_more_then_100k']

from sklearn.preprocessing import LabelEncoder
le_company = LabelEncoder()
le_job = LabelEncoder()
le_degree = LabelEncoder()

inputs['company_n'] = le_company.fit_transform(inputs['company'])
inputs['job_n'] = le_job.fit_transform(inputs['job'])
inputs['degree_n'] = le_degree.fit_transform(inputs['degree'])

inputs_n = inputs.drop(['company','job','degree'],axis='columns')

from sklearn import tree
model = tree.DecisionTreeClassifier()
model.fit(inputs_n,target)

model.score(inputs_n,target)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)