Cloudera QuickStart VM HiveQL无法回答一些简单的查询

问题描述

enter image description here

我有一个包含上述数据的csv文件。我正在使用Cloudera快速入门VM Hive创建表:

create table book(ISBN STRING,Title STRING,Author STRING,Year INT,Publisher STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; 

成功用数据填充了它:

LOAD DATA INPATH 'book.csv' OVERWRITE INTO TABLE book;

运行一个有效的简单查询

SELECT year,count(title) from book group by year;

但是,即使应该有结果,其他简单查询也不会给出结果:

SELECT year,count(title) from book WHERE year < 1990 group by year;

没有给出结果:

查询ID = cloudera_20201007084949_df676aeb-fefb-4a90-a3cc-f16a11dc9fc5 职位总数= 1 启动工作1之1 未指定的缩减任务数。根据输入数据大小估算:1 为了更改减速器的平均负载(以字节为单位): 设置hive.exec.reducers.bytes.per.reducer = 为了限制减速器的最大数量: 设置hive.exec.reducers.max = 为了设置恒定数量的减速器: 设置mapreduce.job.reduces = 开始工作= job_1602081925810_0011,跟踪URL = http://quickstart.cloudera:8088/proxy/application_1602081925810_0011/ 杀死命令= / usr / lib / hadoop / bin / hadoop job -kill job_1602081925810_0011 第1阶段的Hadoop作业信息:映射器数量:1;减速机数量:1 2020-10-07 08:49:35,718第1阶段地图= 0%,减少= 0% 2020-10-07 08:49:45,242第1阶段映射= 100%,减少= 0%,累计cpu 1.99秒 2020-10-07 08:49:53,677第1阶段映射= 100%,减少= 100%,累积cpu 3.47秒 MapReduce累计cpu总时间:3秒470毫秒 结束的工作= job_1602081925810_0011 MapReduce作业启动: 阶段1:映射:1减少:1累积cpu:3.47秒HDFS读取:10550 HDFS写入:0成功 MapReduce花费的总cpu时间:3秒470毫秒 好 花费时间:30.864秒

我运行了另一个简单的查询

SELECT MAX(year)FROM book;

那也没有结果。 这两个查询sql是正确的,我遗漏了什么吗?任何帮助将不胜感激。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)