问题描述
我正在研究从文本文件创建的 RDD。当我对其应用映射操作时,原始 RDD 会发生变化。我原来的 RDD 有这种格式:
[('dfta_id',('provider_name','sponsor_name','contract_budget','Borough'))]
我这样应用函数:
def func(lines):
lines=(lines[1][1],(lines[1][0],lines[2]))
return lines
rdd1=oldrdd.map(func)
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)