嵌入模式下,元数据保存在Derby数据库中,且只允许一个会话连接,若尝试多个会话连接时会报错。下面讲解Hive安装之嵌入模式的配置步骤。
下载Hive安装包
首先在Apache镜像网站下载Linux下的Hive安装包(本次教材使用1.2.1版本),下载完毕后,将安装包apache-hive-1.2.1-bin.tar.gz上传至Linux系统中(本次操作在hadoop01节点上进行演示说明)的/export/software文件夹下,将压缩包解压至/export/servers文件夹下,命令如下:
$ tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /export/servers/
嵌入模式下,无需对Hive配置文件进行修改,只需要启动Hive安装包下的bin目录下的Hive程序即可,具体指令如下所示:
$ bin/hive
执行上述指令后,就进入到Hive交互式界面,效果如图1所示。
图1 Hive交互式界面
进入如图1所示的Hive交互式界面后,就可以输入查询数据仓库的指令进行相关操作,该指令与MySQL查询数据库命令一致。
例如,在Hive交互式界面输入“show databases”指令查看当前所有数据库列表,效果如图2所示。
图2 查询Hive数据仓库列表
从图2可以看出,使用与MySQL操作相同的“show databases”语句查询Hive当前所有数据库列表成功,并返回唯一一个default数据仓库,该default数据仓库是Hive自带的也是默认的存储仓库。
当退出Hive客户端时我们发现,在当前路径下默认生成了derby.log文件,该文件是记录用户操作Hive的日志文件,由于嵌入模式元数据不会共享,那么在其他路径下打开Hive客户端会创建新的derby.log文件,因此上一客户端进行的任何操作当前用户均无法访问。