腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
RocksDB
for
HDFS
?
、
、
、
我正在编写一个在
HDFS
上运行的Spark应用程序,输出是一个RDD,我必须将其保存到
RocksDB
。但我不知道
如何
让
RocksDB
与
HDFS
和Spark一起工作。请给我一些关于
如何
在
HDFS
上设置
RocksDB
并将其与Spark集成的说明 我们已经访问了网站https://github.com/facebook/
rocksdb
/tree/master/
hd
浏览 76
提问于2019-10-07
得票数 0
1
回答
Apache flink:从
RocksDB
后端的存储点延迟加载
、
、
我们希望
使用
带有
RocksDB
后端(
HDFS
)的Apache Flink来进行有状态流处理。但是,我们的应用程序状态(键控状态)将是of级的。据我所知,当我们从保存点恢复作业时,所有操作员状态数据都将从
HDFS
上的保存点位置发送到每个任务管理器。如果状态是to级的,那么如果所有这些状态都需要传输,那么每次部署都将导致非常长的停机时间。我想知道,在
RocksDB
的情况下,是否可以配置延迟加载,其中键控状态在需要时从
HDFS
中检索,然后缓存到本地磁盘上。 谢谢!
浏览 29
提问于2020-04-23
得票数 0
1
回答
状态是否保存在TaskManager的内存中,而与后端的状态无关?
env = StreamExecutionEnvironment.getExecutionEnvironment() env.setStateBackend(new FsStateBackend("
hdfs
我的意思是,当一个检查点完成时,检查点数据将保存在
HDFS
(chk-XXX)或
RocksDB
中,但是当flink作业继续运行时,taskManager将积累越来越多的属于该任务管理器的状态,它们总是保存在内存中吗是否可以在TaskManager进程中
使用
RocksDB
来保存TM的状态数据?谢谢
浏览 18
提问于2020-09-07
得票数 0
回答已采纳
1
回答
我可以在本地文件系统中
使用
flink
rocksDB
状态后端吗?
、
我正在探索
使用
Flink
rocksDb
状态后端,文档似乎意味着我可以
使用
常规的文件系统,比如:file:///data/flink/checkpoints,但是代码javadoc在这里只提到了
hdfs
我想知道是否可以
使用
本地文件系统与flink
rocksdb
后端,谢谢!Flink代码:
浏览 3
提问于2019-10-29
得票数 3
回答已采纳
2
回答
如何
将
HDFS
设置为flink的状态后端
、
、
、
我希望将flink store存储在
HDFS
中,以便在崩溃后可以从
HDFS
恢复flink状态。我计划每隔60秒将状态写入
HDFS
。我
如何
才能做到这一点?这是我需要遵循的配置吗?
浏览 129
提问于2021-11-01
得票数 0
回答已采纳
2
回答
Flink网络缓存
使用
率高,导致Kafka滞后
、
、
、
会话窗口将需要累积会话的所有事件,并
使用
ProcessWindowFunction处理它们。 我们
使用
Flink 1.9,128个容器,总共20G内存来运行我们的作业,截止率是0.3。当会话窗口开始触发process函数时,网络缓冲区
使用
率开始变得非常高,然后我们开始得到Kafka输入滞后。我们的设置: state.backend:
rocksdb
state.backend
浏览 170
提问于2020-10-16
得票数 1
1
回答
Flink,setDbStoragePath方法在RocksDBStateBackend中做什么?
我在RocksDBStateBackend中
使用
flink 1.11,代码如下所示:stateBackend.setDbStoragePath(config.getString("/tmp/
rocksdb
/")); env.setStateBackend
浏览 0
提问于2021-02-24
得票数 0
回答已采纳
1
回答
RocksDB
是否可以将其备份源从本地更改为远程可靠源?或者,是否存在类似的系统?
、
、
、
、
我需要找到或开发一个模块,它可以支持:1.支持快速数据事务2.将所有状态异步备份到远程源(
HDFS
、GFS) 3.清除连续数据(如小于时间戳的数据)4.从远程源恢复 C++,just需要顺序读取。MQ和
RocksDB
基本上可以满足我的需求,但是MQ只支持java,
RocksDB
的随机查找对我没有用(可能会影响性能),同时,我不知道
如何
将备份目录更改为远程可靠的源。
浏览 24
提问于2020-09-25
得票数 0
1
回答
无法
使用
Flink Processor API恢复检查点状态
、
、
state.checkpoints.dir:
hdfs
:///.../checkpointsstate.backend.incremental: truestate.backend.
rocksdb
.localdir/
rocksdb
浏览 19
提问于2020-10-27
得票数 0
回答已采纳
1
回答
Flink检查点不断失败
、
我们正在尝试
使用
RocksDB
后端设置一个有状态的Flink作业。我们
使用
会话窗口,间隔30分钟。我们
使用
aggregateFunction,所以不
使用
任何闪烁状态变量。我们总共
使用
了10G内存和Flink 1.9,128个容器。以下是设置: state.backend:
rocksdb
state.bac
浏览 58
提问于2020-10-13
得票数 3
回答已采纳
1
回答
Flink
RocksDB
性能问题
、
、
、
我有一个flink作业(scala),它基本上是从kafka主题(1.0)读取数据(1分钟的事件时间滚动窗口,
使用
折叠函数,我知道这个函数不推荐,但比聚合函数更容易实现),并将结果写入两个不同的kafka问题是--当我
使用
FS状态后端时,一切都运行顺利,检查点需要1-2秒,平均状态大小为200 mb --也就是说,直到州大小增加(例如,缩小差距)。我想我会尝试用于检查点的
rocksdb
(通过
hdfs
),但是吞吐量明显低于fs状态后端。据我所知,在
使用
fs状态后端时,flink不需要对每个状态访问进行se
浏览 1
提问于2018-11-11
得票数 3
1
回答
Flink:关于flink检查点和保存点的查询
、
下面是我对Flink的疑问。
浏览 1
提问于2020-02-28
得票数 1
回答已采纳
1
回答
无法编译
rocksdb
,找不到依赖项
、
、
我正在尝试编译一个
使用
rocksdb
的程序。现在,我正在编译的文件在A文件夹中。db.h但是在A/
rocksdb
-master/include/
rocksdb
/中。因此,我将这一行添加到我的文件中:它会找到这个文件,但问题是在db.h中,我有下面这行代码:
浏览 2
提问于2015-09-01
得票数 0
1
回答
将unique_ptr与需要指针指针的接口一起
使用
,指向抽象类
我
使用
的是
RocksDB
,它需要一个指向指针的指针才能打开:
rocksdb
::DB* db{nullptr}; const
rocksdb
::Status status =
rocksdb
::DB::Open(options, path, &db); 不出所料,我想
使用
unique_ptr。, fileFullPath, &(db.get())); 我得到了: error: lvalue required as unary ‘&’ operand 如果我
浏览 32
提问于2021-09-27
得票数 0
回答已采纳
1
回答
Flink的故障恢复过程
然后从
HDFS
下载检查点,每个操作员加载状态。加载完成后,源端将继续发送数据。我说的对吗?有没有人知道正确和详细的恢复过程?
浏览 3
提问于2019-04-03
得票数 0
1
回答
Flink增量CheckPointing压缩
、
、
、
、
基本上是its : KafkaSource.keyBy(keyId).SlidingWindow(stream,幻灯片).reduce.sink那么,什么是检查点永远运行作业的最好方法呢? 它将拥有数以百万计的独特keyId。
浏览 6
提问于2022-11-07
得票数 0
1
回答
向
Rocksdb
的CMakeLists添加gRPC依赖
、
、
我正尝试在
rocksdb
的源代码中直接
使用
gRPC secondary我正在将它直接添加到
rocksdb
的源代码中。add_library(${
ROCKSDB
_STATIC_LIB} S
浏览 227
提问于2021-02-19
得票数 0
2
回答
Flink
rocksdb
每插槽内存配置问题
当state.backend.
rocksdb
.memory.managed设置为true时,每个任务槽中的每个rockdb都
使用
4GB内存。我的一些任务不需要
rocksdb
后端,所以我想通过设置state.backend.
rocksdb
.memory.fixed-per-slot: 6000m将这4GB增加到6GB。正如您所看到的,当没有设置state.backend.
rocksdb
.memory.fixed-per-slot和state.backend.
rocksdb
.memory.m
浏览 20
提问于2022-11-15
得票数 0
回答已采纳
2
回答
在R包中构建
rocksdb
静态库
、
、
、
我试着在R包里
使用
rocksdb
。我
使用
了以下src/MakevarsPKG_LIBS =
rocksdb
/librocksdb.a -lbz2 -lz -lzstd -llz4 -lsnappy
rocksdb
/librocks
浏览 2
提问于2019-09-29
得票数 2
回答已采纳
1
回答
在运行时存储一个庞大的Map对象以供另一个工具重用的最佳方法是什么?
、
、
、
然后重新
使用
map对象(在工具的另一次运行中),作为已经编译和填充的映射。1.这真的是最具表现力的解决方案吗?和我读过几篇关于序列化和存储对象的文章,但我不完全确定它们是否与我所需要的相同。
浏览 0
提问于2019-07-04
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在Kerberos环境使用Flume采集Kafka数据并写入HDFS
HDFS 使用 RBF 注意事项
zdpgo_hdfs使用教程之快速入门
0512-使用Python访问Kerberos环境下的HDFS
Flink 使用 RocksDB 和 Gemini 的性能对比实验
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券