SANSA 堆栈上的 Scala 异常检测

问题描述

我试图执行一个在 git repo 中可用的异常检测算法

https://github.com/SANSA-Stack/Archived-SANSA-Examples/blob/master/sansa-examples-spark/src/main/scala/net/sansa_stack/examples/spark/ml/outliers/anomalydetection/AnomalyDetection.scala

截取以下代码会引发错误

val setData = clusterOfSubject.repartition(1000).persist(StorageLevel.MEMORY_AND_disK)
val setDataStore = setData.map(f => f.toSeq)

val setDataSize = setDataStore.filter(f => f.size > anomalyListLimit)

val test = setDataSize.map(f => outDetection.iqr2(f,anomalyListLimit))

但是,当程序计算 iqr 时,我收到以下错误。我知道我们需要用 seq 替换 set。由于我是 Scala 的新手,我不知道如何更改数据类型。 toSeq 函数已应用于所有数据点。

:154: 错误:类型不匹配;发现:设置[(字符串,字符串, Object)] 需要:Seq[(String,String,Object)] val test = clusterOfSubject.map(f => outDetection.iqr2(f,anomalyListLimit))

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)