spark get_json_object - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

从配置单元中的JSON数组获取JSON密钥时遇到的问题

、、

Tasks": 1894 ] ,j.job_id ,get_json_object(spark_event,concat('$.Stage Infos[',e.i,'].Stage ID')) as stage_id ,get_json_object (spark_event,concat('$

浏览 13提问于2020-10-29得票数 0

回答已采纳

1回答

使用Pyspark查询dataframe中的json对象

、、、、

我有一个具有以下模式的MySql表：path-varchar我使用JDBC驱动程序将pyspark连接到MySql。我可以使用以下命令从mysql检索数据这个查询运行得很好。我的问题是，如何查询"info“列？例如，下面的查询在Pyspark shell和检索数据中工作得很好，但在MySQL (2+)

浏览 0提问于2017-01-10得票数 6

回答已采纳

3回答

Spark Scala中嵌套模式的字符串函数

、

我正在用Scala编程语言学习Spark。

浏览 32提问于2019-11-26得票数 1

回答已采纳

1回答

如何从星火scala中的json列中提取值？

、

customer1", "Hi"), ).toDS().toDF() val out = MyClass.procOut(spark

浏览 1提问于2022-11-09得票数 1

回答已采纳

1回答

from_json Pyspark SQL函数:未找到键的默认值？

、、、

我像往常一样使用from_json Pyspark SQL函数，例如： >>> import pyspark.sql.types as t>>> df = sc.parallelize(['{"a":1}', '{"a":1, "b":2}', '{"a":1, "b":2, "c":3}']).to

浏览 20提问于2019-04-11得票数 2

2回答

为什么提取的json值都是空的？

%pythonfrom pyspark.sql.functions import get_json_object df2_extractJSON = df2.with

浏览 6提问于2022-11-25得票数 0

回答已采纳

1回答

从jdbc列中获取一个值

、、

mysql数据源用于将数据加载到Spark中，在string中有一个包含JSON的列。// JDBC Connection and load table in Dataframe val verDf = spark.read.format("jdbc").option("driver",

浏览 2提问于2021-01-20得票数 0

回答已采纳

1回答

从星火阵列中提取值

、、、、

customer_details 我正在使用以下代码：error: invalid string interpolation $., expected: $$, $identifier or ${expression} spark.sql(s""&quo

浏览 7提问于2022-04-29得票数 1

回答已采纳

1回答

为什么在spark和sql工具中运行'get_json_object‘会返回不同的结果？

、、、

我已经开发了一个hive查询，它使用横向视图和get_json_object来解压一些json。使用jdbc客户端(dbvisualizer)对hive数据库执行查询已经足够好了，但是当在java应用程序中作为spark sql在相同的数据上运行时，它什么也不会返回。我已经追踪到这个问题是因为'get_json_object‘函数返回的内容不同。当从java应用程序中作为spark sql运行相同的查询时，将返回null。我注意到另一个不同之处:路径'$.product_offer.productNam

浏览 51提问于2019-09-03得票数 0

1回答

如何更新Spark中的数据框列

、、、

50"}, {"A": "20", "B": "30"}] | +------------------------+---------------------------------------+ spark

浏览 22提问于2021-08-04得票数 1

回答已采纳

2回答

Scala Spark如何将列array[string]转换为包含JSON数组的字符串？

、、

我有一个包含字符串数组的列，我需要将它转换为JSON字符串列表吗？原始值：[a,b,c]转换值："[\"a\",\"b\",\"c\"]"

浏览 45提问于2018-07-26得票数 2

回答已采纳

2回答

来自Json字符串的Spark dataframe，带有嵌套键

、、、、

import spark.implicits._ ("1", """{"k": "foo", "v": 1.0}""", "some_other_field_1"),false) .withColumn("other1",col("o

浏览 33提问于2021-04-25得票数 0

回答已采纳

1回答

Spark中不支持JSONPATH通配符的任何解决方法

、、

spark.sql("""select get_json_object('{"k":{"value":"abc"}}', '$.*.value') as j""").show()但是是否有一种方法来实现这是Spark。

浏览 4提问于2022-02-17得票数 2

回答已采纳

1回答

使用Scala解析字符串列以获得日期格式的数据

、、、

我的.avro文件中有一个类型为String的列(.avro)，我需要使用Scala获得yyyy:mm:ss格式的数据(如预期的输出所示)。请让我知道是否有任何方法可以通过编写一个UDF来实现这一点，而不是使用我下面的方法。任何帮助都将不胜感激。 "TriggeredDateTime": {"dateTime":{"date":{"year":2019,"month":5,"day":16},"time":{"hour":4,"minute":56,

浏览 3提问于2019-11-21得票数 1

回答已采纳

1回答

如何在Apache Spark中分解JSON数组

、

给定一个包含JSON数组的spark 2.3 DataFrame，我如何将这些数组转换为JSON字符串的Spark数组？这也不同于查询是对特定键的查找的情况，get_json_object确实涵盖了这一点。我的后盾是编写一个UDF，它接受JSON字符串并返回一个spark数组，但UDF往往比内置的慢，爆炸性的JSON很可能是核心的Spark功能。为什么要重写基础知识呢？

浏览 2提问于2018-09-17得票数 2

1回答

Spark Read Json:如何读取在整型和结构型之间交替的字段

、、

尝试将多个json文件读取到一个dataframe中，两个文件都有一个"Value“节点，但此节点的类型在整数和结构之间交替：{}{ "Value": "On", "IsSystemValue": true}|---------------------|-

浏览 5提问于2020-06-06得票数 1

回答已采纳

1回答

如何使用PySpark从现有临时表中解析json字符串？

、、

我有一个现有的Spark dataframe，它的列如下：pid | response 12 | {"status我在网上查找了一些使用explode和后来的视图的示例，但它似乎不适用于Spark 2.1.1

浏览 2提问于2017-09-07得票数 8

回答已采纳

1回答

配置单元嵌套get_json_object在select查询中工作良好，但在create table中返回null作为select查询-奇怪的行为

、

get_json_object(column3,concat(get_json_object())),as field_of_interest 我编写了上面的构造我在其他列中使用get_json_object，它们不是嵌套的。它们可以很好地填充。只有这一列没有。这可能是什么原因造成的？我该如

浏览 33提问于2019-02-26得票数 0

1回答