腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2197)
视频
沙龙
1
回答
星星之火:
Dataframe
序列化
、
、
、
、
如何打印当前
使用
的
序列化
程序
的名称;我想知道
spark
.serializer是Java还是
Kryo
。我有下面的代码,它应该
使用
Kryo
序列化
;用于
dataframe
的内存大小变为21 same,这是在没有
序列化
的情况下
缓存
时的四分之一;但是当我删除
Kryo
配置时,大小保持相同的21 same。这是否意味着
Kryo
从一开始就没有被
使用
过?可能是因为
浏览 1
提问于2017-12-26
得票数 5
2
回答
在火花中广播Joda DateTime时出错
、
、
当
使用
Joda Time处理
Spark
时,下面的代码将导致java.lang.NullPointerException val todayBroadcast = sc.broadcast(new DateTime
浏览 0
提问于2016-03-01
得票数 3
回答已采纳
3
回答
什么时候在
Spark
中
使用
Kryo
序列化
?
、
、
、
我已经在用conf.set("
spark
.rdd.compress","true")和persist(MEMORY_AND_DISK_SER)压缩RDDs了。
使用
Kryo
序列化
会使
程序
更有效率吗,还是在这种情况下没有用处?我知道
Kryo
是用于在节点之间以更有效的方式发送数据。但是,如果通信的数据已经被压缩,还需要它吗?
浏览 1
提问于2016-10-26
得票数 13
1
回答
将
Spark
保存到Elasticsearch -无法处理类型异常
、
、
、
我设计了一个简单的工作,可以从MySQL读取数据,并将其保存在
使用
Spark
的Elasticsearch
中
。LOGGER.info("Loading
DataFrame
");
DataFrame
df它将数据读入
DataFrame
中
,选择一些列,然后执行count作为对
Dataframe
的基
浏览 0
提问于2015-09-19
得票数 7
回答已采纳
3
回答
在
Spark
中
需要
kryo
序列化
(Scala)
、
我打开了
kryo
序列化
,如下所示:我希望确保在节点之间混洗时
使用
我可以这样用
kryo
注册这个类:据我所知,这实际上并不能保证kyro
序列化
被
使用
;如果
序列化<
浏览 0
提问于2015-07-14
得票数 34
回答已采纳
1
回答
Spark
-
Kryo
vs JavaSerialization同样的尺寸?
、
我正在对
Spark
使用
缓存
。现在,我
使用
了几个
缓存
,其中一些内存约为20 in。我先是尝试了cache(),然后又尝试了persist和MEMORY_SER,它的大小很大,所以我改成了java
序列化
,其中一些
序列化
达到了20 of左右。现在,我想
使用
Kryo
,我已经注册了类,我没有得到任何错误,但它的大小与我在大多数
缓存
中
使用
Kryo
执行它时相同。有没有办法知道它是否
使用<
浏览 47
提问于2018-08-10
得票数 0
1
回答
为什么需要编码器来创建
spark
中
的数据集
、
而对于创建数据集,我们需要
使用
隐式编码器,否则,它就会产生编译时错误。我只在这方面有几个问题。以下是我的代码: val ds: Datasetds.write .parquet(configuration.outputPath)以下是我的问题: 为什么在创建数据集时
使用
编码器很重要从
浏览 3
提问于2018-12-27
得票数 4
回答已采纳
2
回答
Kryo
在SparkSQL中有帮助吗?
、
、
Kryo
通过高效的
序列化
方法帮助提高
Spark
应用
程序
的性能。case c
浏览 1
提问于2018-03-14
得票数 6
回答已采纳
3
回答
RDD的
缓存
什么时候过期?
、
我们在RDD上
使用
.cache()对数据集进行持久
缓存
,我关心的是
缓存
何时过期?dt.cache()
浏览 0
提问于2016-05-10
得票数 11
回答已采纳
3
回答
在光束
Spark
runner中注册用于
Kryo
序列化
的自定义类
、
、
我已经看到光束火花跑步者
使用
BeamSparkRunnerRegistrator进行
kryo
注册。是否也有注册自定义用户类的方法?
浏览 16
提问于2017-08-17
得票数 1
1
回答
如
何在
火花代码
中
设置
Kryo
的不可修改的集合
序列化
程序
、
我正在
使用
Java
中
的
Kryo
序列化
(v1.6.1),在
序列化
一个类时,它在其字段中有一个集合,它引发以下错误- at com.esotericsoftware.
kryo
.
Kryo
.readObject(
Kryo
.java:648)... 27 more 我发现这是因为<em
浏览 0
提问于2017-10-18
得票数 5
回答已采纳
1
回答
使用
hashmap引发
序列化
问题
、
、
、
我正在尝试
序列化
一个Java类,它的对象将在Java
中
收集。POJO包含一些数据结构,
如
HashMap和ArrayList。当我试图迭代驱动
程序
中
的RDD对象并试图获取hashmap元素时,它会抛出一个Serialization exception。: java.lang.NullPointerException
序列化
跟踪:at com.esotericsoftware.
kryo</e
浏览 0
提问于2015-10-15
得票数 0
回答已采纳
1
回答
scala星星之火mllib fpgrowth每次返回不同的答案。
、
、
、
我
使用
的是星火1.5.0 (cdh5.5.2)。我在事务数据上运行FpGrowth算法,每次都得到不同的结果。我
使用
linux命令检查了事务数据,发现没有区别。Scala
中
的fpgrowth函数
中
是否有随机种子?为什么每次我会得到不同数量的频繁项集?有随意断的领带吗?另外,我
使用
一个非常低的支持值--当我增加支持时,这个问题就不存在了。我
使用
的支持是0.000459。当我把这个增加到0.005的时候,我不会得到这个错误。是否有任何最低限度的支持需要
使用
? 谢谢你的帮助。
浏览 1
提问于2016-02-29
得票数 0
回答已采纳
1
回答
如
何在
Spark
中
使用
Kryo
序列化
程序
缓存
DataFrame
?
、
、
、
我正在尝试
使用
Spark
与
Kryo
序列化
程序
来存储一些数据,而内存成本更低。现在我遇到了一个麻烦,我不能用
Kryo
序列化
程序
在内存中保存一个DataFram e(类型为DatasetRow)。我认为我所需要做的就是添加org.apache.
spark
.sql.Row to classesToRegister,但是错误仍然出现:
spark
-shell --conf
spark
.
kryo</e
浏览 3
提问于2017-02-24
得票数 0
2
回答
Apache
Spark
:
Kryo
中
的类注册顺序
、
根据
Kryo
文档,在
Kryo
中注册的类应该在
序列化
和反
序列化
期间分配相同的标识符据我所知,由
spark
内部注册的类和
使用
方法sparkConf.registerKryoClasses注册的类都会根据注册顺序自动分配标识符,因此此注册顺序
中
的任何更改都可能破坏反
序列化
的可能性。请帮助我理解这个问题是如
何在
Apache
Spark
浏览 1
提问于2015-09-30
得票数 2
4
回答
kryo
.readObject引起NullPointerException与ArrayList
、
当我
使用
kryo
取消对一个NullPointerException对象的
序列化
时,我会得到一个ArrayList。ArrayList.java:215) at com.esotericsoftware.
kryo
.serializers.CollectionSerializer.read(CollectionSerializer.java:96) at com.esotericsoftware.<e
浏览 2
提问于2014-05-30
得票数 11
回答已采纳
2
回答
当您
使用
Pyspark时,您从
Kryo
序列化
程序
中
受益吗?
、
、
我读到
Kryo
序列化
程序
在Apache中
使用
时可以提供更快的
序列化
。但是,我正在通过Python
使用
Spark
。 我仍然从切换到
Kryo
序列化
程序
中
得到显著的好处吗?
浏览 15
提问于2016-03-29
得票数 13
回答已采纳
1
回答
了解星火的关闭及其
序列化
、
、
、
它有一个字段,用于存储类不实现可
序列化
(NonSerializable)的对象。我已经将"
spark
.serializer“配置选项设置为
使用
Kryo
。内部时,我发现它在我的RDD上
使用
了它的闭包
序列化
程序
,这是
序列化
程序
,而不是我所期望的
Kryo
序列化
程序
。我已经读到
Kryo
在
序列化
闭包方面有问题,
Spark
总是<e
浏览 1
提问于2016-10-26
得票数 18
1
回答
Spark
Serializer
Kryo
setRegistrationRequired(假)
、
、
我在Scala/
Spark
程序
中
使用
weka.mi.MISVM,需要
序列化
我的内核以便以后重用它们。为此,我
使用
Kryo
如下所示:conf.registerKryoClassespatterns: RDD[(Multiset, MISVM)] = ...
浏览 0
提问于2017-03-30
得票数 0
1
回答
星火系列化
、
、
、
org.apache.
spark
.scheduler.DAGScheduler$$anonfun$org$apache$
spark
$scheduler$DAGScheduler$$submitStage(我签入了标准库代码,字符串大小写不敏感的比较器被声明为可
序列化
,这样就有意义了)。为什么我不应该在这里
使用
羔羊?因为我只
使用
静态方法和类,所以我希望第二种和最后一种方法都能正常工作。我发现特别奇怪的是,我已经将我试图
序列化
的类注册到
Kryo
,而我没有注册的类可以与它们的
浏览 3
提问于2015-05-27
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark的内存管理和调优机制
Spark SQL,DataFrames 以及 Datasets 编程指南
Spark关键性能考量
Spark踩坑记:Spark Streaming+kafka应用及调优
Flink 流式计算在节省资源方面的简单分析
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券