如何使用我们选择的输入测试逻辑回归模型?

问题描述

我目前正在研究克利夫兰数据集,其中有 14 列......我在这个数据集上执行的一些步骤是

1.did 创建了虚拟变量,因为有分类值——将数据集分成 28 个特征

2.删除了一些高度相关的值——使其成为 22 个特征

3.Did递归特征消除--列/特征的最佳数量仍然是22

4.做了主成分分析

5.使用逻辑回归预测

6.达到 85% 的准确率

现在我想用我自己的一组基于 13 个特征[目标变量除外]的初始数据集来尝试它,它看起来像这样 =[[78,1,4,111,239,2,155,7]]

我将列表转换为数据框以遵循创建虚拟变量、删除相关值等类似步骤...

但我一直坚持创建虚拟变量,因为它给了我只有 13 列的数据框,而我期望的是 28..

谁能帮我解决这个问题? 或者我如何提供输入?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)