R caretsvmRadial保持sigma不变,并使用网格搜索C

问题描述

我正在用useMachine()实现带有径向基函数内核('svmRadial')的支持向量机。据我了解的文档和源代码,caret使用解析公式来获取sigma的合理估计并将其固定为该值(根据输出:调整参数'sigma'保持恒定为一个值0.1028894)。此外,caret对一组成本参数C(默认= 3)进行交叉验证。

但是,如果现在要设置自己的成本参数网格(tuneGrid),则必须另外指定sigma值。否则会出现以下错误:

错误:调整参数网格的列应为sigma,C

如何根据解析公式修复Sigma并仍然实现自己的成本参数C网格?

这是MWE:

caret

解决方法

如果您查看该模型的信息,它会显示如果不提供该网格将如何生成:

getModelInfo("svmRadial")$svmRadial$grid

function(x,y,len = NULL,search = "grid") {
                    sigmas <- kernlab::sigest(as.matrix(x),na.action = na.omit,scaled = TRUE)
                    if(search == "grid") {
                      out <- expand.grid(sigma = mean(as.vector(sigmas[-2])),C = 2 ^((1:len) - 3))
                    } else {
                      rng <- extendrange(log(sigmas),f = .75)
                      out <- data.frame(sigma = exp(runif(len,min = rng[1],max = rng[2])),C = 2^runif(len,min = -5,max = 10))
                    }
                    out
                  }

所以获取它的方法是使用kernlab::sigest估计sigma,首先我们为svmRadial提取出网格方法:

models <- getModelInfo("svmRadial",regex = FALSE)[[1]]

由于要提供公式,因此请设置输入x和y:

preProcValues = preProcess(Boston.train,method = c("center","scale")) 
processData = predict(preProcValues,Boston.train)
x = model.matrix(medv ~ .,data=processData)[,-1]
y = processData$medv

我们为此模型使用了网格功能,您可以看到它与您的输出相同:

set.seed(1)
models$grid(x,3)

      sigma    C
1 0.1028894 0.25
2 0.1028894 0.50
3 0.1028894 1.00

svmR$results
      sigma    C     RMSE  Rsquared      MAE    RMSESD RsquaredSD     MAESD
1 0.1028894 0.25 5.112750 0.7591398 2.982241 0.8569208 0.05387213 0.4032354
2 0.1028894 0.50 4.498887 0.8046234 2.594059 0.7823051 0.05357678 0.3644430
3 0.1028894 1.00 4.055564 0.8349416 2.402248 0.8403222 0.06825159 0.3732571

这是下面发生的事情:

set.seed(1)
sigmas = kernlab::sigest(as.matrix(x),scaled = TRUE)
# from the code,you can see it takes the mean of the two extreme quantiles

mean(sigmas[-2])
[1] 0.1028894

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...