python中的逻辑回归-初学者-重塑数据集

问题描述

您好:我正在尝试在 python 中测试逻辑回归模型我有一个特征以及数据集中的因变量。当我运行分类器时,我收到以下消息:

bool

我该如何纠正?

此外 - 这是一个不平衡的数据集。结果仅出现在数据集中约 1% 的记录中。我欢迎您提出任何解决此问题的建议,无论是过采样还是欠采样等。

谢谢!

解决方法

您有一个 X 值和一个 Y 值。由于通常有许多 X 变量来预测一个 Y 变量,因此逻辑回归模型需要这样的输入:

[[1],[2],[3]]

这与过采样或欠采样无关,您的输入数据格式不正确。

您可以像这样将 1d 转换为 2d 列表:

X = [1,2,3,4]
X = [[item] for item in X]

或者使用 numpy 数组:

X = X.reshape(-1,1)
,

只需传递 X.reshape(-1,1) 而不是 X