select from parquet表在配置单元中不返回任何内容

文章/答案/技术大牛

发布

1回答

、、

(“employee.parquet”)create external table employees (a String, b String, c Int) stored as PARQUET location

浏览 4提问于2016-07-28得票数 0

1回答

配置单元表在查询时显示0个结果

、

浏览 10提问于2021-02-10得票数 0

1回答

配置单元外部分区表

、、、

首先，我创建了按代码和日期分区的配置单元外部表(SAL BIGINT,INPUTFORMAT "parquet.hive.DeprecatedParquetInputFormat"LOCATION '&

浏览 2提问于2014-11-03得票数 6

回答已采纳

1回答

需要替换存储在hdfs中的地块文件中的控制字符

、、、

我正在将数据作为拼图文件从MySQL导入hdfs，并在其上构建一个配置单元外部表，但该文件中几乎没有不需要的控制字符，这些字符也被加载到配置单元表中。我需要用一个空字符串替换它们。以下是返回问题的spark代码。PYSPARK代码：# using SQLContext to read parquet file from pyspark.sql imp

浏览 3提问于2017-12-02得票数 0

2回答

在拼图文件上创建Hive表失败-我哪里出错了？

、、、

我要把数据帧保存到拼图文件中。生成的模式如下所示："type":"struct", { "name":"rule", "nullable":true, "m

浏览 0提问于2017-11-08得票数 0

1回答

hadoop/hdfs中的默认存储文件格式

、、

我希望对其进行配置，以便每当将文件复制到集群(通过copyFromLocal或使用sqoop等)时，hadoop/hdfs应该以拼板文件格式存储数据。这件事我期待的对吗？有可能吗？我认为应该有一个hdfs级别的配置参数，在那里我可以指定在存储数据时使用哪种格式，但不知怎么找不到。想知道我是不是漏掉了什么东西。

浏览 2提问于2015-11-06得票数 1

回答已采纳

1回答

如何将数据从拼图文件导入到现有的Hadoop表？

、、

我在Hadoop集群中创建了一些表，我有一些带有数据的拼板表可以放入其中。我该怎么做？我想强调的是，我已经有了一些DDL命令创建的空表，并且它们也存储为parquet，所以我不需要创建表，只需要导入数据。

浏览 4提问于2021-12-10得票数 -1

3回答

在配置单元中将空白转换为NULL

、

我试图通过设置属性'serialization.null.format' = ''将源文件中的空白值转换为配置单元表格中的NULL。我在hive中编写的查询是： create table test(a int, b string) stored as parquet TBLPROPERTIES('serialization.null.format

浏览 3提问于2016-04-01得票数 3

1回答

创建具有多个parquets的配置单元

、、

我正在创建的配置单元表应该只从2014q1到2020q2拉取数据。我该如何实现这一点？

浏览 16提问于2020-08-29得票数 0

1回答

我能否将集群A中的Hive表与集群B中的Hbase表连接起来

、

我的客户有一个计算场景，一些数据存储在集群A的Hive中，另一些数据存储在集群B的Hbase中，然后他们想要对这两种表进行一些连接操作。那么有没有一种方法可以让我在Hive中这样做：配置</em

浏览 1提问于2018-05-26得票数 1

1回答

在配置单元表中加载拼图文件将返回全部为空

、、

我有几个文件存储在HDFS中，我正在尝试在hive中创建一个新的外部表，它应该指向这些数据文件。所以，我在hive中创建了一个表格-ORDERID INT, CUSTOMER_ID INT,STATUS STRING)LOCATION 'hdfs:///user

浏览 0提问于2016-10-18得票数 0

2回答

很容易将Json登录到spark schemaRDD中，并且有一个用于schemaRDD的saveAsTable方法，但它只适用于从HiveContext创建的schemaRDD，而不适用于从常规SQLContext有没有办法强制它与HiveContext“绑定”并保存到Hive中？我看不出有什么明显的原因是做不到的。我知道有像saveAsParquetFile这样的数据持久化选项，但我们真的很想利用Hive。

浏览 0提问于2014-09-15得票数 4

1回答

如何使用Trino读取位于s3上的拼花文件？

我安装Apache-钻，在盒子里他有s3 conector。在Apache中，演练一种用法若要从文件拼板中选择所有内容，请执行以下操作。我要在Trino(Presto)中这样做，但我没有结果(有错误)。我怎么能在Trino(Presto)里做同样的事？：当我创建带有选项external_location和格式的外部表时，我可以从中选择

浏览 9提问于2022-06-27得票数 1

回答已采纳

5回答

如何在Hive中将数据插入到拼图表格中

、、

我有一个简单的文本表(用"，“分隔)，格式如下：CREATE TABLE parquet_test (orderID INT, CustID INT, OrderTotal FLOAT, ROW FORMAT SERDE '

浏览 0提问于2014-04-18得票数 7

2回答

通过sparkSQL创建蜂窝

、、、

我对蜂巢中的扣环有一个疑问。我已经创建了一个临时表，该表在列关键字上存储桶。当我检查这个表的基目录时，它显示了前缀为part_*的文件名。但是，当我通过另一个表手动将数据插入到这个表中时，我看到了以00000_*为前缀的文件。我不确定spark sql是否将数

浏览 1提问于2018-08-02得票数 5

1回答

使用Amazon Athena复制时，为什么Parquet文件变小

、、、、

我有一个由Hive填充的Hive分区表，并作为拼图存储在S3上。特定分区的数据大小为3 3GB。然后我用雅典娜复制一份： CREATE TABLE tmp_partitionFROM original_table 'org.apache.hadoop.hive.ql.io.parquet</em

浏览 14提问于2019-05-16得票数 0

1回答

HIve:由于“顶点由于OWN_TASK_FAILURE没有成功”而导致表创建失败

、

尝试另一个来自Table_1的Table_1CREATE TABLE Table_2FIELDS TERMINATED BY',' STORED AS INPUTFORMAT OUTPUTFORMAT 'org.apache.had

浏览 0提问于2019-06-07得票数 2

回答已采纳

1回答

即使地块文件包含数据，外部未分区的配置单元表也会显示0条记录，使用spark.read.parquet读取时会显示正确的数据

、

我在Azure DataBricks上创建了一个外部的未分区配置单元表。LOCATION '/mnt/data/reference/data/DATE_FILE' 'parquet.compress'='SNAPPY' ) 在我从其他位置复制的位置上当我执行select * from reference.da

浏览 3提问于2021-01-16得票数 1

回答已采纳

4回答

parquet上的配置单元外部表未获取数据

、、、、

我正在尝试创建一个datapipeline，其中的收入数据被存储到拼图中，并且我创建了一个外部的hive表，用户可以查询hive表并检索数据，.I能够保存拼图数据并直接检索它，但是当我查询hive表时，它不会返回任何行。/emp’ 现在在一些数据上创建了dataframe并保存到parquet。from parquet sqlcon

浏览 47提问于2018-12-14得票数 1

回答已采纳

1回答

无法将数据从地块文件加载到配置单元外部表

、、、

._ import org.apache.spark.sql.SaveMode HDFS状态：然后，我已经使用下

浏览 6提问于2017-08-15得票数 0

回答已采纳

点击加载更多