自动加载功能文件格式

问题描述

具有 Autoloader 功能,根据文档,配置cloudFiles.format支持json,csv,文本,镶木地板,二进制文件等。想知道是否支持XML吗?

解决方法

对于流文件数据源,支持的文件格式为文本,CSV,JSON,ORC,Parquet。我的假设是仅支持流文件格式。

不确定是否有机会使用spark-xml库浏览https://github.com/databricks/spark-xml中的更复杂的xml文件。如果要利用此功能,自动加载程序将无济于事。