Cloudera QuickStart VM HiveQL无法回答一些简单的查询

问题描述

我有一个包含上述数据的csv文件。我正在使用Cloudera快速入门VM Hive创建表：

create table book(ISBN STRING,Title STRING,Author STRING,Year INT,Publisher STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE;

成功用数据填充了它：

LOAD DATA INPATH 'book.csv' OVERWRITE INTO TABLE book;

运行一个有效的简单查询：

SELECT year,count(title) from book group by year;

但是，即使应该有结果，其他简单查询也不会给出结果：

SELECT year,count(title) from book WHERE year < 1990 group by year;

没有给出结果：

查询ID = cloudera_20201007084949_df676aeb-fefb-4a90-a3cc-f16a11dc9fc5 职位总数= 1 启动工作1之1 未指定的缩减任务数。根据输入数据大小估算：1 为了更改减速器的平均负载（以字节为单位）：设置hive.exec.reducers.bytes.per.reducer = 为了限制减速器的最大数量：设置hive.exec.reducers.max = 为了设置恒定数量的减速器：设置mapreduce.job.reduces = 开始工作= job_1602081925810_0011，跟踪URL = http://quickstart.cloudera:8088/proxy/application_1602081925810_0011/ 杀死命令= / usr / lib / hadoop / bin / hadoop job -kill job_1602081925810_0011 第1阶段的Hadoop作业信息：映射器数量：1；减速机数量：1 2020-10-07 08：49：35,718第1阶段地图= 0％，减少= 0％ 2020-10-07 08：49：45,242第1阶段映射= 100％，减少= 0％，累计cpu 1.99秒 2020-10-07 08：49：53,677第1阶段映射= 100％，减少= 100％，累积cpu 3.47秒 MapReduce累计cpu总时间：3秒470毫秒结束的工作= job_1602081925810_0011 MapReduce作业启动：阶段1：映射：1减少：1累积cpu：3.47秒HDFS读取：10550 HDFS写入：0成功 MapReduce花费的总cpu时间：3秒470毫秒好花费时间：30.864秒

我运行了另一个简单的查询：

SELECT MAX(year)FROM book;

那也没有结果。这两个查询的sql是正确的，我遗漏了什么吗？任何帮助将不胜感激。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）