问题描述
我有一个带有一列字符串的PySpark Dataframe。我确实发现这些列是否为数字。但是现在我想在“值”列中找到多少个TRUE。
values = [('25q36',),('75647',('13864',('8758K',('07645',)]
df = sqlContext.createDataFrame(values,['ID',])
df.show()
+-----+
| ID|
+-----+
|25q36|
|75647|
|13864|
|8758K|
|07645|
+-----+
我确实应用了以下内容
from pyspark.sql import functions as F
my_df.select(
"ID",F.col("ID").cast("int").isNotNull().alias("Value ")
).show()
+-----+------+
| ID|Value |
+-----+------+
|25q36| false|
|75647| true|
|13864| true|
|8758K| false|
|07645| true|
+-----+------+
但是现在我想知道该列中有多少个TRUE或False。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)