问题描述
我有两个Scala DataFrame,我正在测试它们的相似性。我希望能够选择一个特定的行号,并比较两个DataFrame之间该行的每个值。例如:
Dataframe 1: df1
+------+-----+-----------+
| Name | Age | Eye Color |
+------+-----+-----------+
| Bob | 12 | Blue |
| Bil | 17 | Red |
| Ron | 13 | brown |
+------+-----+-----------+
Dataframe 2: df2
+------+-----+-----------+
| Name | Age | Eye Color |
+------+-----+-----------+
| Bob | 12 | Blue |
| Bil | 14 | Blue |
| Ron | 13 | brown |
+------+-----+-----------+
输入:第2行,输出:年龄,眼睛颜色。
理想的是输出也显示不同的值。我已经考虑了选项here,但问题是我的DataFrames非常大(超过200,000行),因此花费的时间太长。有没有一种简单的方法可以在Scala中选择数据框的特定行值?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)