腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在windows 10中启动
hbase
shell时出错
C:\hadoop-3.2.1\
hbase
\bin>
hbase
shell将ruby文件打包到jar中并使用jruby的引导来调用它们,从而取代了这个文件。如果您出于某种原因需要
源码
这个文件,它现在被命名为'jar-bootstrap.rb‘,位于文件
hbase
-shell.jar的根目录中,并位于
源码
树中的'
hbase
-shell/src/main/ruby
浏览 95
提问于2021-01-14
得票数 0
1
回答
Beeline无法创建外部
hbase
表,但配置单元cli可以
、
、
我有
hbase
1.2.3集群,并安装了hive 2.1.1。当我尝试通过beeline/hiveserver2创建外部
hbase
表时,我得到了异常。但是如果我使用hive cli,它是可以的。create语句如下: stored by 'org.apache.hadoop.hive.
hbase
.HBaseStorageHandler' with serdepropert
浏览 5
提问于2017-01-06
得票数 0
1
回答
运行MR代码将数据加载到
HBASE
中
、
、
我是
HBASE
新手,我正尝试从HDFS将数据加载到
HBASE
中,但每次运行MR时都无法执行此操作所有的类文件都在那里我不知道哪里出了问题.To运行MR首先我编译了
源码
并将hadoop和
hbase
库包含在类路径中然后我生成了"
hba
浏览 3
提问于2012-02-27
得票数 0
回答已采纳
2
回答
如何使用flume从mysql中读取数据?
、
、
、
如何使用flume从mysql连续读取数据加载到
hbase
? 我熟悉sqoop,但我需要从mysql
源码
中不断地使用它。是否需要自定义源才能做到这一点?
浏览 3
提问于2012-10-02
得票数 3
5
回答
单节点上的
hbase
安装
、
现在,我正在尝试在其上安装
hbase
(0.94.18版)。但是我得到了以下错误(尽管我已经将其解压缩到/usr/local/
hbase
中):
浏览 1
提问于2014-05-11
得票数 3
1
回答
Hadoop context.write()缓冲区大小
、
、
、
我正在使用带有puts的context.write()从映射器写入
HBase
。根据这个,context.write()不会立即刷新,而是等待缓冲区填满,然后才将它们异步设置到服务器。目的是通过调整缓冲区大小来减少对
HBase
表的RPC调用。
浏览 6
提问于2015-08-07
得票数 0
2
回答
是否有可能从
hbase
转换为spark rdd效率?
、
、
、
我在
hbase
中有一个很大的项目数据集,我想要加载到spark rdd中进行处理。我的理解是,
hbase
针对hadoop上的低延迟单项目搜索进行了
优化
,所以我想知道是否有可能在
hbase
中高效地查询1亿个项目(大约10TB大小)?
浏览 1
提问于2017-10-25
得票数 0
2
回答
Cloudera 5.4.4群集-获取聚合使用指标
、
、
我想从Cloudera5.4.4 Hadoop集群中收集聚合使用指标。我心目中的一些指标如下: 提前感谢!
浏览 1
提问于2015-09-03
得票数 1
回答已采纳
1
回答
为什么
HBase
的全扫描和聚集速度比拼板慢,尽管它也是柱状数据库?
、
、
、
、
我试过使用
Hbase
,第1点和第3点都满足了。但是我发现在
HBase
上进行分析(加载/保存/聚合)非常慢,比使用Parquet慢10倍。我不明白为什么Parquet和
Hbase
都是柱状DBs,而且我们已经很好地分散了
HBase
集群中的工作负载(“每个区域的请求”这么说)。 有什么建议吗?我是不是用错工具做这份工作了?
浏览 0
提问于2018-07-16
得票数 1
回答已采纳
1
回答
上传到
Hbase
后数据大小减小
、
、
、
当文件作为记录从linux机器上传到
Hbase
表时,我们观察到数据大小的减少(文件系统上为10 GB,
Hbase
表中为6-8 GB )。在
hbase
表上没有使用压缩方法,主要压缩也被禁用。
浏览 47
提问于2021-06-23
得票数 0
1
回答
在Spark的MLlib中使用TFIDF生成过程中的内存不足异常
、
、
、
为了给出一个规模概念,我从
HBase
中读取了大约61.5万个(约4GB的文本数据)小文档,并运行了带有8核和6GB执行器内存的spark程序。我已经尝试过增加并行级别和洗牌内存分数,但没有效果。
浏览 1
提问于2014-09-18
得票数 4
回答已采纳
1
回答
使用现有值在
HBase
中向上插入
、
、
我使用
HBase
来存储一些流数据,我有从一个插入到另一个插入的值,并且使用现有的值。我有一个这样创建的表:
hbase
(main):005:0> create ‘mytable’,’mycolfam’ 该表将包含一个名为val的字段 首先,按原样插入数据(key=1、val=10):
hbase
(main):005:0> put 'mytable','1','mycolfam:val',10 然后,我有了相同键'1‘的传入数据(key=1,val=12),并且<
浏览 13
提问于2019-04-02
得票数 2
回答已采纳
1
回答
谁执行
HBase
过滤器?
、
、
哪台机器执行org.apache.hadoop.
hbase
.filter.Filter?因为过滤器是不能串行化的
浏览 0
提问于2018-05-10
得票数 3
回答已采纳
2
回答
HBase
作为web应用后端
、
有人能建议让
HBase
作为基于web的应用程序的主要数据源是否是个好主意吗?我主要关心的是
HBase
对查询的响应时间。有可能有亚秒级的反应吗? 该应用程序将用于显示存储在
HBase
中的数据,例如在过去的24小时中关键字"X“发生了多少次。对于该应用程序80%的请求,我将知道确切的键,20%的请求是扫描(我正在研究与
HBase
模式设计相关的主题,以使其运行得更快)
浏览 0
提问于2012-10-28
得票数 3
1
回答
我想要扫描大量的数据(基于范围的查询),在编写数据时,我可以做什么
优化
,以便扫描变得更快?
、
我在
hbase
中有十亿行,我想一次扫描百万行。什么是最好的
优化
技术,我可以做,使这个扫描尽可能快。
浏览 4
提问于2011-12-08
得票数 3
回答已采纳
1
回答
存储TimeStamp的最佳方法
、
、
、
然后,CSV文件将数据导出到MySQL和
HBase
数据库。我有大约2亿条记录(1TB),因此我需要
优化
每个处理步骤。我应该使用什么数据类型来存储Python、CSV、MySQL和
HBase
数据库中的TimeStamp值?我需要存储TimeStamp值的所有方面。我的模式在CSV文件、MySQL和
HBase
数据库表中有4列。 谢谢!
浏览 0
提问于2015-03-10
得票数 1
2
回答
哪一个是最好的
HBase
连接器用于批量加载数据到
HBase
从火花?
、
正如在中也提到的,主要有两个选项: 我对一个接一个的记录不感兴趣,而是对高吞吐量感兴趣。在深入研究代码之后,似乎两者都求助于TableOutputFormat、DataFrame库是否为大容量加载提供了与RDD库相比的性能改进
浏览 2
提问于2017-11-08
得票数 1
1
回答
利用HADOOP的遥感图像数据
、
实际上,我对hadoop环境并不熟悉,而且遇到了很多困难。有人能帮忙完成以下任务吗?
浏览 0
提问于2018-09-18
得票数 1
3
回答
HBase
上的配置单元与HDFS上的配置单元
、
、
、
我的数据不需要实时加载,所以我不需要使用
HBASE
,但我想知道在MR Jobs中使用
HBASE
是否有任何性能优势,由于索引数据,连接不是应该更快吗? 有人有什么基准吗?
浏览 1
提问于2012-07-29
得票数 2
回答已采纳
2
回答
使用
Hbase
shell手动拆分
Hbase
区域
我们面对的是
HBase
区域的热点。所有写操作都被重定向到一个区域服务器,因此某些映射需要花费大量时间。我想手动拆分区域使用
HBase
外壳,但可以找到任何示例。拆分地域服务器最好的
优化
方式是什么?
浏览 0
提问于2016-03-16
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
HBase优化之预分区
HBase性能优化之表的设计
Hbase数据库检索性能优化策略
Kylin 在贝壳的性能挑战和 HBase 优化实践
HBase 写吞吐场景资源消耗量化分析及优化
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券