'DataFrame'对象没有属性'orderby'

问题描述

我正在我的应用程序上使用azure databrick。 而且我使用ML进行插补。得到结果后,我想加入并合并以使其成为完整的数据集,以便可以将其写入blob存储。

df3 = spark.sql("""

select * from df1 
FULL OUTER JOIN df2 
on df1.columnindex == df2.columnindex

""")

完成连接后,我显示了结果,并发现'columnindex'中缺少很多索引,因此我执行orderBy

df3 = df3.orderBy('columnindex')

在我看来,索引没有丢失,但没有正确排序。 但是当我进行工会之后

df5 = spark.sql("""

select * from unmissing_data 
union
select * from df4

""")

并执行orderBy

df5  = df5.orderBy('columnindex')

我收到以下错误:'DataFrame'对象没有属性'orderby'。有人知道为什么会这样吗,为什么我在“ columnindex”列中的初始索引没有像在原始数据集中那样正确排序?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)