有没有办法使s3对象中的Spark Structured Streaming监视器版本更改?

问题描述

所以我有一个文件s3a://some-bucket/streaming/csv/file.csv,其中包含以下内容

name,number
John Doe,1

我正在运行的代码是:

userSchema = StructType().add('name','string').add('number','integer')

default_path = "s3a://some-bucket/streaming"

df = (spark.readStream
      .format("csv")
      .schema(userSchema)
      .load(f"{default_path}/csv/")
)

squery = (df.writeStream
    .format("parquet")
    .option('mode','update')
    .option("checkpointLocation",f"{default_path}/checkpoint/")
    .option("path",f"{default_path}/parquet/")
    .start()
)

问题是,是否有一种方法可以上传具有相同名称内容不同的文件并进行更改? 即: s3a://some-bucket/streaming/csv/file.csv

name,2

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)