问题描述
具有 Autoloader 功能,根据文档,配置cloudFiles.format支持json,csv,文本,镶木地板,二进制文件等。想知道是否支持XML吗?
解决方法
对于流文件数据源,支持的文件格式为文本,CSV,JSON,ORC,Parquet。我的假设是仅支持流文件格式。
不确定是否有机会使用spark-xml库浏览https://github.com/databricks/spark-xml中的更复杂的xml文件。如果要利用此功能,自动加载程序将无济于事。
具有 Autoloader 功能,根据文档,配置cloudFiles.format支持json,csv,文本,镶木地板,二进制文件等。想知道是否支持XML吗?
对于流文件数据源,支持的文件格式为文本,CSV,JSON,ORC,Parquet。我的假设是仅支持流文件格式。
不确定是否有机会使用spark-xml库浏览https://github.com/databricks/spark-xml中的更复杂的xml文件。如果要利用此功能,自动加载程序将无济于事。