首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

安装和配置Hive

安装和配置Hive 2018-7-17 作者: 张子阳 分类: 大数据处理 直接通过MapReduce来对存储在Hadoop HDFS上的数据进行查询和分析比较繁琐而且还需要编程。...Hive是一个数据仓库系统,构建在HDFS之上,它提供了类似SQL的语法(HQL),可以将HQL翻译成MapReduce作业进行查询,使得对数据的管理和检索更为便利。...Driver : org.apache.derby.jdbc.EmbeddedDriver Metastore connection User: APP Starting metastore...schema initialization to 2.3.0 Initialization script hive-schema-2.3.0.derby.sql Initialization script...查看存储在HDFS上的数据库文件 至此,就可以通过命令行来对Hive进行操作管理了。接下来,需要深入地去学习Hive的“SQL语句”,除此以外,还要掌握通过编程的方式对Hive进行操作。

1.9K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    hive的安装

    接着,执行了一系列的sql命令,还创建了一个新的数据库test,同时在该数据库中创建了一个test01表,最后在该表中插入了一条数据。 记住:我在这里已经创建了一个新数据库test。...② 在bin目录的上一层目录apache-hive-2.3.6-bin,执行hive这个启动命令。 分析如下: 从上图可以看出:我们切换到bin目录的上一级目录下,启动hive。...在不同的目录下启动hive执行相关sql操作,需要从新进行元数据初始化的工作。...这就说明: derby元数据库只记录了,第一次进行元数据库初始化后,在那个bin目录下所执行的任何sql命令的元数据信息。...总结如下: derby作为hive的默认数据库,也不是不可以,只是说我们在哪里执行的初始化操作,以后就必须在该目录下执行相关的sql操作。

    1.8K20

    Apache Hive 快速入门

    从其他表查询数据并创建新表 63.2.4.3. 从其他表查询数据然后插入指定表中 63.2.4.4. 63.2.3.1. 创建视图 63.2.3.2. 删除视图 63.2.2.1....创建分区表 63.2.2.2. 显示分区情况 63.2.2.3. 增加分区 63.2.2.4. 向分区表导入数据 63.2.1.1. 创建表 63.2.1.2. 显示表 63.2.1.3....子查询 Hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据。...其在Hadoop的架构体系中承担了一个SQL解析的过程,它提供了对外的入口来获取用户的指令然后对指令进行分析,解析出一个MapReduce程序组成可执行计划,并按照该计划生成对应的MapReduce任务提交给...MySQL 默认情况下, Hive 使用内嵌的 Derby 数据库保存元数据, 通常生产环境会使用 MySQL 来存放 Hive 元数据。

    1.1K80

    「EMR 开发指南」之 Sqoop 常见问题处理

    背景Sqoop是一种用于在Apache Hadoop和结构化数据存储(如关系数据库)之间传输数据的开源工具。...问题一:Sqoop无法初始化derby class问题异常:Error:Could not initialize class org.apache.derby.jdbc.AutoloaderDriver40...解决过程:去sqoop lib目录查看对应的包,发现有多个derby包;然后全盘搜了一下集群中使用derby的包为什么版本;然后删除了sqoop lib下多余的derby包,问题解决。...原因:这种情况一般是之前遇到过derby相关的sqoop问题,从网上找的解决方案随便下载了一个derby包放在sqoop lib下,导致包冲突。...问题三:Sqoop 在使用 cos 存储场景下自动创建 orc 表需求:客户期望在使用cos做存储的场景下做sqoop自动建表(表不存在自动创建);客户另一方面期望在使用orc存储的场景下做sqoop自动建表

    52840

    Hadoop Hive与Hbase整合+thrift

    简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。...使用Derby数据库安装 什么是Derby安装方式 •Apache Derby是一个完全用java编写的数据库,所以可以跨平台,但需要在JVM中运行 •Derby是一个Open...source的产品,基于Apache License 2.0分发 •即将元数据存储在Derby数据库中,也是Hive默认的安装方式 1 .Hadoop和Hbase都已经成功安装了 Hadoop...另外,你必须在创建Hive库表前,在HDFS上创建/tmp和/hive/warehousedir(也称为hive.metastore.warehouse.dir的),并且将它们的权限设置为chmod g...1.创建hbase识别的数据库: CREATE TABLE hbase_table_1(key int, value string) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler

    1.6K20

    Hive3连接RDBMS和使用函数

    JdbcStorageHandler查询RDBMS 使用JdbcStorageHandler,可以将Hive连接到MySQL,PostgreSQL,Oracle,DB2或Derby数据源。...将数据加载到群集中某个节点上受支持的SQL数据库(如MySQL)中,或使自己熟悉数据库中的现有数据。 2....当无法使用内置函数来执行所需的操作时,可以创建用户定义函数(UDF)。您可能需要重新加载函数以更新在另一个会话中创建的函数的可用性。...注册UDF 在群集中,您登录到Hive,然后从Beeline运行命令以使UDF在Hive查询中起作用。在HiveServer重新启动之间,UDF仍然存在。 5....在查询中调用UDF 注册UDF之后,无需在查询中使用UDF之前重新启动Hive。在此示例中,您调用在SELECT语句中创建的UDF,Hive返回您指定的列的数据类型。

    1.4K30

    大数据之脚踏实地学09--Hive嵌入式安装

    当用户从客户端(如图中的CLI或JDBC)发送一条SQL语句时,会经过包含4个组间的驱动器,分别用于SQL解析(如检查语法是否正确,查询的字段是否包含在元信息中等)、SQL编译(将SQL语法编译成MapReduce...解压Hive 首先从Apache网站(http://archive.apache.org/dist/)下载一个稳定版的Hive(如本文使用的是稳定版Hive2.3.4),然后将该软件通过Xftp上传至master...具体操作如下: 修改hive.metastore.schema.verification,将对应的值设置为false,即阻止hive校验HDFS、Map-Reduce和Yarn的版本; 创建一个tmp目录...初始化代码如下: schematool -initSchema -dbType derby ?...接下来我们创建一张表,并把root家目录下的200M+的文件导入到Hive中(数据来源于Kaggle网站,是关于美国911电话呼叫的记录,总计约280万数据)。 ? 建表语法 ?

    65650

    一脸懵逼学习Hive(数据仓库基础构架)

    Hive 定义了简单的类 SQL  查询语言,称为 QL ,它允许熟悉 SQL  的用户查询数据。...(2)Hive是SQL解析引擎,它将SQL语句转译成M/R Job然后在Hadoop执行。     (3)Hive的表其实就是HDFS的目录/文件,按表名把文件夹分开。...如果是分区表,则分区值是子文件夹,可以直接在M/R Job里使用这些数据。...mysql, derby 中; Hive 将元数据存储在数据库中(metastore),目前只支持 mysql、derby。...HDFS 中存在的数据,可以创建 Partition;   (2)它和 内部表 在元数据的组织上是相同的,而实际数据的存储则有较大的差异;   (3)内部表 的创建过程和数据加载过程(这两个过程可以在同一个语句中完成

    3K100

    h2数据库使用_数据库教程

    服务器模式(Server Mode):使用服务器模式和内嵌模式一样,只不过它可以跑在另一个进程里。 混合模式: 第一个应用以内嵌模式启动它,对于后面的应用来说它是服务器模式跑着的。...(Server)|org.apache.derby.jdbc.ClientDriver|jdbc\:derby\://localhost\:1527/test;create\=true|sa 18=Generic...Derby (Embedded)|org.apache.derby.jdbc.EmbeddedDriver|jdbc\:derby\:test;create\=true|sa 19=Generic H2.../{path}/{fileName} 在当前程序的根目录下创建目录和数据库文件 ~/{path}/{fileName} 在当前用户的根目录下创建目录和数据库文件(windows即用户目录,Linux...即home目录) C:/{path}/{fileName} 在指定盘符的指定目录下创建数据库文件 附加参数: AUTO_SERVER=TRUE 启动自动混合模式,允许开启多个连接,该参数不支持在内存中运行模式

    3.4K10
    领券