问题描述
您好:我正在尝试在 python 中测试逻辑回归模型。我有一个特征以及数据集中的因变量。当我运行分类器时,我收到以下消息:
bool
我该如何纠正?
此外 - 这是一个不平衡的数据集。结果仅出现在数据集中约 1% 的记录中。我欢迎您提出任何解决此问题的建议,无论是过采样还是欠采样等。
谢谢!
解决方法
您有一个 X 值和一个 Y 值。由于通常有许多 X 变量来预测一个 Y 变量,因此逻辑回归模型需要这样的输入:
[[1],[2],[3]]
这与过采样或欠采样无关,您的输入数据格式不正确。
您可以像这样将 1d 转换为 2d 列表:
X = [1,2,3,4]
X = [[item] for item in X]
或者使用 numpy 数组:
X = X.reshape(-1,1)
,
只需传递 X.reshape(-1,1)
而不是 X
。