腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Apacke
Spark
中
使用
StructType
创建
JSON
schema
、
我正在尝试为下面的
JSON
创建
StructType
模式 { "country":[ "area":9596960("SELECT countries FROM country"); namesDF.show(); 我正在获取nulls,我可以知道如何
使用
StructType
解析
Json
字段来获取
浏览 18
提问于2019-12-23
得票数 0
2
回答
为给定的
json
定义火花模式
、
我
在
没有指定模式的情况下将这个
json
加载到
Spark
: "titles": { { } }df.printSchema|-- element: struct (containsNull = true)我试图将这个
json
模式转换为下面的代码,但失败了: AS = <
浏览 3
提问于2022-10-23
得票数 0
回答已采纳
6
回答
如何在
spark
中将Avro
Schema
对象转换为
StructType
、
、
、
我有一个行类型的RDD,即RDDRow和avro
schema
对象.I需要用这个信息
创建
一个数据帧。 为了
创建
DataFrame,我需要将avro
schema
对象转换为
StructType
。
浏览 5
提问于2016-11-24
得票数 8
12
回答
如何
创建
一个空的DataFrame?为什么"ValueError: RDD是空的“?
、
我正在努力
创建
一个空的数据
在
火花(火花)。df = sqlContext.createDataFrame(sc.emptyRDD(),
schema
)Traceback (most recent call last):File "<stdin>", line 1, in <module> File "/Users/Me/Desktop/
spark
浏览 4
提问于2016-01-06
得票数 34
回答已采纳
1
回答
使用
预定义的模式更新
Spark
推断的DataFrame模式
、
在
处理数据时,我希望
使用
组合模式(基本模式+推断模式),以便考虑所有列/字段。我现在遵循下面的方法。我想知道是否有更好/更快的方法来实现这一点。
StructType
predefinedSchema = (
StructType
) DataType.fromJson(predefinedSchemaJsonString); Dataset<Row> dfWithInferredSchema =
spark
.read().
json
(incomingDatase
浏览 14
提问于2021-09-07
得票数 1
1
回答
使用
可选值从
json
导入模式
、
、
、
我正在尝试从
json
数据源
创建
一个表。是否有可能编写一个模式,使我只
在
缺少值的列中
使用
null?._import org.apache.
spark
.sql.=
StructType
(Seq(
浏览 4
提问于2017-12-05
得票数 1
4
回答
如何在星火中
创建
架构文件
、
、
、
我正在尝试读取一个
Schema
文件(这是一个文本文件),并将它应用到我的CSV文件
中
,而没有头文件。因为我已经有了一个模式文件,所以我不想
使用
InferSchema选项,这是一种开销。我的输入模式文件如下,我正在尝试下面的代码来
创建
一个模式文件, val
schema
_file =
spark
.read.textFile("D:\\Users\\Document
浏览 1
提问于2018-05-24
得票数 5
回答已采纳
2
回答
Avro模式引发
StructType
、
、
、
这实际上与我的相同,但
使用
Avro而不是
JSON
作为数据格式。我正在
使用
一个
Spark
dataframe,它可以从几个不同的模式版本中加载数据:{"namespace": "com.example.avro", {"name": "B&quo
浏览 1
提问于2015-11-25
得票数 7
2
回答
从
json
模式表示
创建
spark
数据帧模式
、
有没有办法将数据帧模式序列化为
json
,并在以后反序列化它? 用例很简单:我有一个
json
配置文件,其中包含我需要读取的数据帧的模式。我希望能够从现有模式(
在
dataframe
中
)
创建
默认配置,并且能够通过从
json
字符串
中
读取相关模式来生成稍后
使用
的相关模式。
浏览 1
提问于2016-12-04
得票数 30
回答已采纳
2
回答
使用
Scala
在
Spark
DataFrame
中
重用
JSON
中
的模式
、
、
、
schema
(dfSc).其中原始架构为dfSc。如果没有这个错误(我不能快速解决这个问题),那么我想
使用
textSc代替dfSc来读入具有强制模式的
JSON
数据。我认为可以
使用
大小写匹配来完成一些编码,以消除双引号。但是,我仍然不清楚需要什么规则才能从测试夹具
中
获得确切的模式,以便在我的循环生产(与测试夹具)代码
中
简单地重用。作为侧栏,
浏览 4
提问于2016-04-20
得票数 7
回答已采纳
1
回答
使用
JavaObject
StructType
、
、
我需要解析一个文件来
创建
一个pyspark.sql.types.
StructType
。我找到了一个,它可以为我做到这一点。所以我这样称呼它:js = f.read()
schema
= conv.convertContent(js)
浏览 5
提问于2017-03-17
得票数 3
回答已采纳
1
回答
如何将
JSON
模式从Camel大小写转换为小写
、
、
、
我有一个
在
camel情况下带有键的
JSON
,并且我正在尝试将所有数据类型转换为小写。我正面临着ArrayType的问题。 import
spark
.implicits._ var sample_
浏览 5
提问于2021-12-26
得票数 1
回答已采纳
2
回答
创建
Spark
DataFrame时从hdfs文件传递架构
、
我正在尝试读取存储
在
hdfs的文本文件
中
的模式,并在
创建
DataFrame时
使用
它。
schema
=
StructType
([StructField("col2",StringType(),True),StructField("col6", jsonDF =
spark
.rea
浏览 0
提问于2019-07-24
得票数 0
1
回答
星星之火Java映射函数将被执行两次
、
、
、
String, String>() { public String call(String patientId) throws Exception {DataFrame dataSchemaDF = sqlContext.read().
json
Save dataframe as parquet file (execution 2) dataSchemaDF.w
浏览 0
提问于2016-10-16
得票数 5
回答已采纳
5
回答
如何从PySpark
中
的数据
中
获取模式定义?
、
、
、
、
在
PySpark
中
,您可以
使用
这个预定义的模式定义模式和读取数据源,例如: ]) 对于某些数据源,可以从数据源推断模式,并
使用
此模式定义获取数据是否有可能从以前已经推断数据的数据
中<
浏览 0
提问于2019-02-03
得票数 36
回答已采纳
1
回答
Java
Spark
-如何从
json
对象生成
structType
、
、
、
如何在java
中
从
JSON
对象
创建
结构类型?
在
我的例子
中
,
JSON
对象是一个AVRO模式(我在下面截断了它)。null},{\"name\":\"VALUE\",\"type\":[{\"type\":\"null\"},{\"type\":\"int\"}],\"default\":null}] } 我不喜欢手动
创建</
浏览 36
提问于2020-10-14
得票数 2
回答已采纳
1
回答
对于
spark
结构化流式处理
Json
记录,架构是否为必填项
、
、
我正在浏览下面的博客
中
的
spark
structured。 .
schema
(cloudTrailSchema) .
json
("s3n://mybucket/AWSLogs/*/CloudTrail例如,
在
spark
batch streaming
中
,我们在
浏览 3
提问于2018-03-23
得票数 1
1
回答
用
spark
.catalog.createTable
创建
一个表
、
、
我试图用
spark
.catalog.createTable
创建
一个表。它需要一个名为"id“的分区列。基于Scala
中
的,我尝试:
浏览 3
提问于2021-09-28
得票数 2
回答已采纳
4
回答
如何将Case类作为模式,在从RDD[String]解析的数据集中将默认值设置为“null”
、
、
但是,当
JSON
字符串不包含case class的所有必需字段时,我会得到一个异常,即找不到缺少的列。我尝试
在
case class
中
定义默认值,但这并没有解决问题。我正在
使用
Spark
2.3.2和Scala2.11.12。(List(jsonData)) val ds =
spark
.read.
json
(jsonRddString).as[SchemaClass] 当我运
浏览 2
提问于2020-06-10
得票数 0
回答已采纳
2
回答
创建
JSON
类型的架构并
使用
Scala
中
的
Spark
读取它[错误:无法解析jsontostructs]
、
、
、
我有一个
JSON
文件,如下所示: {"Codes":[{"CName":"012","CValue":"XYZ1234","CLevel":"0","msg":"","CType":"event"},{"CName":"013","CValue":"ABC1234","C
浏览 4
提问于2021-03-22
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark之SparkSQL
遇见YI算法之初识Pyspark(二)
Spark SQL DataFrame与RDD交互
Spark SQL,DataFrames 以及 Datasets 编程指南
简化TensorFlow和Spark互操作性的问题:LinkedIn开源Spark-TFRecord
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券