Spark SQL中使用COUNT和GROUP BY

、、、、

----------+--------------------+-------------------+----------+---------+--------------------+dayofweek count2 -> 343 (Tuesday)如有任何帮助，非常感谢！

浏览 1提问于2016-12-27得票数 1

回答已采纳

2回答

、

| 250--------------1075 | 2from table 1order by 1 但我一直收到错误我尝试过使用和不使用别名，但都无济于事。

浏览 43提问于2019-09-13得票数 0

回答已采纳

2回答

在spark.sql中选择具有组的多个元素

、、、

在选择我正在使用的多个元素代码的sql spark中，是否有按表分组的方法：df.createOrReplaceTempView("GETBYID")val sqlDF = spark.sql( "SELECT count(customerId) FROM GETBYID

浏览 7提问于2017-01-02得票数 2

回答已采纳

1回答

我有以下涉及UNION的Spark (2.4.0)查询。现在，我试图限制优化器从其查询的物理计划中排除特定规则，以便Spark只为这两个查询创建一个Exchange。SET "spark.sql.optimizer.excludeRules" = org.apache.spark.sql.catalyst.optimizer.PushDownPredicate;select a, count(*) as cnt<e

浏览 1提问于2020-07-20得票数 0

回答已采纳

1回答

如何在Spark* SQL中查询Avro表*

、、

我在配置单元0.13中有键/值表(键和值都是avro类型)。当我尝试在Spark SQL 1.1中运行查询时，我得到了以下错误(在配置单元中它是有效的)... key struct<constructtypespark-sql> select key.constructtype, count(*) from

浏览 4提问于2014-09-16得票数 1

1回答

如何将sql查询转换为和PySpark数据

、、、、

SELECT county, state, deaths, cases, count (*) as count GROUP BY county, state, deaths,cases 我通过SQL从上面的查询中获得以下数据。我想要的是将这两个SQL查询转换为PySpark请让我知道，因为我对熊猫和PySpark都是新手注意-我不想使用

浏览 4提问于2020-04-22得票数 0

1回答

如何将sql输出转换为Dataframe？

、、

我有一个Dataframe，从它创建一个临时视图以运行sql查询。经过几个sql查询之后，我想将sql查询的输出转换为一个新的Dataframe。我希望数据回到Dataframe的原因是为了能够将它保存到blob存储中。%scala... var df = spark.read.parquet(some_p

浏览 0提问于2022-07-20得票数 3

回答已采纳

2回答

查找列(称为text)中是否有单词pyspark

、、、、

我需要找到单词(而不是子字符串)，如果它旁边有标点符号，我也需要计算它，例如： id group text2 c no you can8 c no&a 2c 0 d 1 我试过这个： sql_q = spark.sql("select group,

浏览 23提问于2020-06-20得票数 1

3回答

如何在结构化查询中使用日期(作为字符串)？

、、

如何以编程方式从星火sql中的日期中减去天数？val date = "2019-10-01" select id, my_table<em

浏览 4提问于2020-01-20得票数 0

回答已采纳

1回答

分组表达式的相关子查询- TreeNodeException:绑定属性，树:计数(1)#382 L

、、、

假设我试图对一些由对(a和b值)组成的样本数据做一些统计。有些对存在多次，另一些则不存在。(''' COUNT(*) as countGROUP BY a, b输出：spark.sql(''' <e

浏览 1提问于2018-11-27得票数 2

回答已采纳

1回答

scala中的Spark会话应用程序格式

、

我是Spark的新手。我用scala编写了一些代码，并在spark-shell中执行。 spark.sql("SELECT district, COUNTs

浏览 0提问于2018-10-31得票数 2

2回答

如何在dsx中使用Scala2.11 with Spark* 2.0笔记本的"display“功能*

、、

在dsx中，有一种方法可以在Scala2.11和Spark 2.0笔记本中使用"display“(我知道可以在python笔记本中使用pixiedust)。例如： WHEREstate = 'CA' GROUP

浏览 3提问于2017-01-28得票数 3

3回答

添加包含按df分组的列数og的列

、、、

如何使用group By子句将列添加到具有行数的DF中？()) type mismatch; (which expands to) org.apache.spark.sql.Dataset[org.apache.spark.sql.Row] required: org.apache.spark.s

浏览 46提问于2019-11-25得票数 2

回答已采纳

1回答

spark As can be列子查询

、

原因: java.lang.RuntimeException:在storeid#4、combox_pid#6、pid#7、count(1)#61L中找不到计数(DISTINCT orderid)#69Las b group by b.pidimport org.apache.spark.sql.orderid,combox_pid,pid,count(distinct order

浏览 0提问于2020-02-10得票数 0

2回答

SQL: count()和group by

我有两张桌子： 1 opera 13 opera1 1 13 1 35 1 77 1 10 Select s1.time, count(s

浏览 6提问于2014-12-06得票数 1

2回答

如何使用scala API在spark* sql中写入大于1的特定列的计数*

我有以下SQL查询：我想使用Spark SQL的DataFrame API将其转换为Spark。

浏览 4提问于2016-05-10得票数 3

2回答

SQL Count()和GROUP BY

我对(简单的) SQL查询有问题。该查询返回9本书，这是可以的。BookLanguages bls ON b.BookID = bls.BookID ANDGROUP如果我只运行该查询FROM Book b JOIN BookLanguages bls ON b.BookID = bls.BookID

浏览 1提问于2012-12-07得票数 0

回答已采纳

1回答

从Pandas groupBy到PySpark groupBy

、、

'c': 'avg',}).withColumnRenamed('sum(b)', 'new_b') 但是，我不知道如何进行'a': x['a'].values[0]和'我曾想过使用来自from pyspark.sql import functions的from pyspark.sql import functions，但这

浏览 5提问于2017-03-14得票数 4

回答已采纳

2回答

如何使用Dataset API (如SQL的“按1分组”或“按2排序”)使用序数？

、、

我能够在Spark‘文字’查询中使用序数(在GROUP BY和ORDER BY之后的这些整数)：但是对于DataFrames/DataSet，我必须始终使用列名： df.select($"ProfileName").groupBy($&quo

浏览 3提问于2017-07-19得票数 2

回答已采纳

1回答

在数据帧上使用聚合操作比使用spark.sql()直接实现SQL聚合有好处吗？

、

我见过来自数据仓库和SQL背景的人正在使用SQL实现聚合和其他转换逻辑(where spark is the sparkSession object) 使用spark.sql()： CITY_CENSUS.createO

浏览 1提问于2019-05-05得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Group by和COUNT值by SQL Spark Spark SQL