问题描述
我在类属性为正或负的单词数据集上使用 arulesCBA。首先,我使用 as.numeric
函数将单词转换为数值。之后,我使用以下代码对列进行离散化:
trans.disc <- as.data.frame(lapply(df[2:75],function(x) discretize(x,categories=9)))
在这一步中,我有警告说:不推荐使用参数类别。改用休息时间!此外,默认方法现在是频率!我应用的下一步是添加极性列:
trans.disc$polarity <- df$polarity
最后一步,我正在尝试构建分类器:
classifier <- CBA(trans.disc,"polarity",supp = 0.05,conf=0.9)
在这个阶段,有一条错误信息说:(Error in discretizeDF.supervised(formula,data,method = disc.method) :data需要是一个data.frame)。
解决方法
看起来您对 CBA 的论据进行了整理。手册页 ?CBA
说:
CBA(
formula,data,pruning = "M1",parameter = NULL,control = NULL,balanceSupport = FALSE,disc.method = "mdlp",verbose = FALSE,...
)