如何在VALUE列中找到多少个TRUE或FALSE

问题描述

我有一个带有一列字符串的PySpark Dataframe。我确实发现这些列是否为数字。但是现在我想在“值”列中找到多少个TRUE。

values = [('25q36',),('75647',('13864',('8758K',('07645',)]
df = sqlContext.createDataFrame(values,['ID',])
df.show()
+-----+
|   ID|
+-----+
|25q36|
|75647|
|13864|
|8758K|
|07645|
+-----+

我确实应用了以下内容

from pyspark.sql import functions as F

my_df.select(
  "ID",F.col("ID").cast("int").isNotNull().alias("Value ")
).show()

+-----+------+
|   ID|Value |
+-----+------+
|25q36| false|
|75647|  true|
|13864|  true|
|8758K| false|
|07645|  true|
+-----+------+

但是现在我想知道该列中有多少个TRUE或False。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)