在Spark 1.3中,有没有办法从mapValues访问密钥?
具体来说,如果我有
val y = x.groupBy(someKey) val z = y.mapValues(someFun)
someFun可以知道它目前在哪个关键操作?
或者我必须这样做
val y = x.map(r => (someKey(r),r)).groupBy(_._1) val z = y.mapValues{ case (k,r) => someFun(r,k) }
注意:我想使用mapValues而不是map的原因是为了保留分区.