spark与hive引擎差异致结果集不一致

Spark 2022-09-04

sql样例

select *
from open.dws_openmall_item_inc_d a
where  a.log_date = '日期'
  and business = 'mall'
  and a.item_id=10022085

hive 执行有两条数据 spark执行有一条数据,经过排查发现存储路径如

表结构

spark 中任务前面有空格的数据字段是' 10022085' 而不是'10022085' 所以查询以上sql仅一条,hive有两条

1_Spark Streaming 概述

1.SparkStreaming是什么？SparkStreaming是SparkCore的扩展A...

本篇内容介绍了“Spark通讯录相似度计算怎么实现”的有关知识...

如何进行Spark数据分析

本篇文章给大家分享的是有关如何进行Spark数据分析，小编觉得...

本篇内容主要讲解“Spark Shuffle和Hadoop Shuffle有哪些区别...

这篇文章主要介绍“TSDB的数据怎么利用Hadoop/spark集群做数...

本篇内容介绍了“Hadoop与Spark性能原理是什么”的有关知识，...

相关文章