Hive的特点是什么

本篇内容介绍了“Hive的特点是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

Hive是构建在hadoop上的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,也急速hi数据提取转化加载(ETL),并提供简单的SQL查询功能,称为HQL(这边要和Hibernate区别一下),允许熟悉sql用户查询数据。它是工作在thrift上的,控制分隔符也允许用户指定数据格式。

Hive的特点

支持索引,加快数据查询

有不同的存储类型,如HBase中的文件、纯文本文件

将元数据保存在关系数据库中,大大减少了在查询过程中执行语义检查的时间

可以直接使用存储在Hadoop文件系统中的数据

内置大量用户函数UDF来操作时间、字符串和其他的数据挖掘工具,支持用户扩展UDF函数来 完成内置函数无法实现的操作

sql查询方式,将SQL查询转换为MapReduce的Job在Hadoop集群上执行。

Hive的缺点

在静态处理的Hadoop上执行延迟高,作业提交和调度开销大,有分钟集的延迟,因此不适合需要低延迟的应用,比如练级事务处理(OLTP)

其中HIVE和hadoop之间的关系

Hive的特点是什么

Hive的特点是什么

Hive的架构如上图所示,包含用户访问接口(CLI、JDBC/ODBC、WEB GUI和Thrift Server)元数据存储(metastore),驱动组件(编译,优化,执行)。

用户访问接口:用户交互Hive数据仓库的工具接口。

CLI(command line interface)命令行接口。

Thrift Server可以用不同语言调用Hive接口

HWI(Hive web interface)提供通过网页访问Hive提供的服务

metastore与Hive驱动互联方式:1.集成模式  2.远程模式

主要用来存储Hive中的元数据,一般使用Mysql或者Derby数据库

驱动组件包括编译器、优化器和执行引擎,分别完成词法分析、语法分析、编译、优化以及查询计划的生成生成查询计划存储在HDFS中并在虽有由MapperReduce调用执行。

“Hive的特点是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程之家网站,小编将为大家输出更多高质量的实用文章

相关文章

今天小编给大家分享一下excel图案样式如何设置的相关知识点,...
这篇文章主要讲解了“win10设置过的壁纸如何删除”,文中的讲...
这篇“Xmanager怎么显示远程linux程序的图像”文章的知识点大...
今天小编给大家分享一下xmanager怎么连接linux的相关知识点,...
这篇“如何重置Linux云服务器的远程密码”文章的知识点大部分...
本篇内容介绍了“Linux云服务器手动配置DNS的方法是什么”的...