Spark-使用数据框语法进行分组?

问题描述

是的,它不存在。您表达了相同的逻辑,agg后跟where

df.groupBy(someExpr).agg(somAgg).where(somePredicate)

解决方法

在不使用sql / hiveContext的Spark中使用groupby-having的语法是什么?我知道我能做

DataFrame df = some_df
df.registreTempTable("df");    
df1 = sqlContext.sql("SELECT * FROM df GROUP BY col1 HAVING some stuff")

但是我该如何使用类似的语法

df.select(df.col("*")).groupBy(df.col("col1")).having("some stuff")

.having()似乎不存在。