问题描述
所以我有一个文件s3a://some-bucket/streaming/csv/file.csv,其中包含以下内容:
name,number
John Doe,1
我正在运行的代码是:
userSchema = StructType().add('name','string').add('number','integer')
default_path = "s3a://some-bucket/streaming"
df = (spark.readStream
.format("csv")
.schema(userSchema)
.load(f"{default_path}/csv/")
)
squery = (df.writeStream
.format("parquet")
.option('mode','update')
.option("checkpointLocation",f"{default_path}/checkpoint/")
.option("path",f"{default_path}/parquet/")
.start()
)
问题是,是否有一种方法可以上传具有相同名称但内容不同的文件并进行更改? 即: s3a://some-bucket/streaming/csv/file.csv
name,2
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)