腾讯云Hbase版怎么用_Hbase版怎么用_腾讯云Hbase怎么用 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Phoenix填坑记2：phoenix-5.0 在hbase2.0.1及以上版本，在使用索引时出错

截止到2020年12月，Phoenix最高只支持到Hbase2.0版本，并不支持更高的版本。而我们采用的是腾讯云HBase，使用的版本是2.2.0版本，我们在使用Phoenix-5.0版本时，发现系统报错，无法正常使用。

02

新数仓系列：Hbase国内开发者生存现状（2）

大数据前几年各种概念争论很多，NoSQL/NewSQL，CAP/BASE概念一堆堆的，现在这股热潮被AI接过去了。大数据真正落地到车联网，分控，各种数据分析等等具体场景。概念很高大上，搞得久了就会发现，大部分都还是数据仓库的衍伸，所以我们称呼这个为“新数仓”，我准备写一系列相关的文章，有没有同学愿意一起来的？请联系我。前面有一些相关文章，大家可以看看：新数仓系列：Hbase周边生态梳理（1）本文简单梳理下其中一个应用比较广的HBASE的国内开发者现状，可能不全，有更多信息或者纠正的，请给我留言。 1

06

您找到你想要的搜索结果了吗？

是的

没有找到

腾讯云 EMR 常见问题100问（持续更新）

Hadoop 目前是数据处理的标准工具，其核心组件包含了HDFS（分布式文件系统）、YARN(资源调度平台)、

04

国内首家Apache基金会白金会员腾讯开源之路再上台阶

前言：9月20日，世界知名的开源软件组织Apache软件基金会（Apache Software Foundation，简称ASF）正式宣布腾讯成为其白金会员。腾讯也是国内首家Apache 软件基金会白金会员。Apache 软件基金会官方高度评价了腾讯在开源领域的贡献，腾讯开源之路再上台阶。国内首家Apache白金会员腾讯成众多项目主导成员 ASF致力于为开源项目提供法律和财务等支持的非营利性组织。该基金会目前支持了超过350个开源项目，涵盖大数据、云计算、数据库、网络服务器等领域。目前基金会白金

03

国外、国内Hadoop的应用现状

摘要：Hadoop是一个开源的高效云计算基础架构平台，其不仅仅在云计算领域用途广泛，还可以支撑搜索引擎服务，作为搜索引擎底层的基础架构系统，同时在海量数据处理、数据挖掘、机器学习、科学计算等领域都越来越受到青睐。本文将讲述国外、国内Hadoop的主要应用现状。

02

Fluid + GooseFS 助力云原生数据编排与加速快速落地

谢远东，腾讯高级工程师，云原生机器学习社区 Kubeflow Member、云原生数据编排与加速框架 Fluid（CNCF Sandbox）核心开发者、Istio Member ，负责腾讯云 TKE 在 AI 场景的研发和支持工作。彭芳，腾讯云容器产品经理，负责腾讯云 TKE 在存储、安全和云原生etcd服务的产品策划工作。前言 Fluid 作为基于 Kubernetes 开发的面向云原生存算分离场景下的数据调度和编排加速框架，已于近期完成了 v0.6.0[1] 版本的正式发布。腾讯云容器 TK

03

Fluid + GooseFS 助力云原生数据编排与加速快速落地

谢远东，腾讯高级工程师，云原生机器学习社区 Kubeflow Member、云原生数据编排与加速框架 Fluid（CNCF Sandbox）核心开发者、Istio Member ，负责腾讯云 TKE 在 AI 场景的研发和支持工作。

05

降本增效成架构师必备技能：酷家乐如何实现全年数据库成本零增长

作者 | 贾驰千、余智平酷家乐中间件团队研发工程师随着云数据库数量以及成本的迅速增加，数据库成本管理和优化成为了企业所关注的方向。酷家乐针对云数据库做了一系列的深度成本优化动作，收益颇丰。本文为详细介绍~ 供你参考。一、背景摘要近年来，随着上云的普遍化，降本成为了备受关注的热门话题。越来越多的企业开始重视云资源的成本优化，FinOps更是横空出世，得到了众多企业的拥抱。作为全球领先的云设计软件平台和 SaaS 服务提供商，（群核科技）酷家乐的产品都构建在公有云之上，截止目前，我们使用了上

04

Fluid + GooseFS 助力云原生数据编排与加速快速落地

Fluid 作为基于 Kubernetes 开发的面向云原生存算分离场景下的数据调度和编排加速框架，已于近期完成了 v0.6.0 版本的正式发布。腾讯云容器 TKE 团队一直致力于参与 Fluid 社区建设，在最新版本中贡献了以下两大特性：缓存引擎高可用运行时、新增数据缓存引擎实现 GooseFSRuntime 。

01

hive学习笔记之八：Sqoop

Sqoop是Apache开源项目，用于在Hadoop和关系型数据库之间高效传输大量数据，本文将与您一起实践以下内容：

05

【优秀最佳实践展播】第12期：流计算 Oceanus

“产品使用攻略”、“上云技术实践” 有奖征集啦～图片案例名称案例简介使用流计算 Oceanus 和 ES 构建日志分析系统介绍从 mysql 数据库采集数据到流计算服务 Oceanus 进行分析，最后输出到 ElasticSearch 服务的实践。可作为日志搜索场景解决方案使用。使用 MySQL 关联 HBase 维表数据到 ClickHouse介绍结合 MySQL 数据库、流计算 Oceanus、HBase 以及云数据仓库 ClickHouse 来构建实时数仓，并通过流计算 Oceanus 读取 MyS

03

3306π嘉宾专访-腾讯云Redis产品总负责人邹鹏

多年数据库、网络安全研发经验，对云计算平台的网络、计算、存储、安全有深入的研究和产品化经验。

03

日吞吐万亿，腾讯云时序数据库 CTSDB 解密

作为腾讯唯一的时序数据库，CTSDB 支撑了腾讯内部20多个核心业务（微信彩票、财付通、云监控、云数据库、云负载等）。

大数据平台是否更应该容器化?

作者颜卫，腾讯高级后台开发工程师，专注于Kubernetes大规模集群管理和资源调度，有过万级集群的管理运维经验。目前负责腾讯云TKE大规模Kubernetes集群的大数据应用托管服务。大数据的发展历史大数据技术起源于Google在2004年前后发表的三篇论文，分布式文件系统GFS、分布式计算框架MapReduce和NoSQL数据库系统BigTable，俗称"三驾马车"。在论文发表后，Lucene开源项目的创始人Doug Cutting根据论文原理初步实现了类似GFS和MapReduce的功能。并在20

03

视频直播：实时数据可视化分析

导语 | 本文描述了如何在腾讯云上使用云化后大数据组件来完成实时分析系统的设计和实现，阅读过程中通过对比云Ckafka、Flink和MySQL等组件的使用差异来体现云化方案的优势。文中以视频直播礼物打赏的场景为例，展示全/半托管服务下开发的便利，便于读者对视频直播系统的设计有一个初步了解。一、解决方案描述（一）概述本方案结合腾讯云CKafka、流计算Oceanus、私有网络VPC、商业智能分析BI等，对视频直播行业数字化运营进行实时可视化分析。分析指标包含观看直播人员的地区分布、各级别会员统计、

04

实时数仓：基于流计算 Oceanus 实现 MySQL 和 HBase 维表到 ClickHouse 的实时分析

实时即未来，最近在腾讯云流计算 Oceanus（Flink) 进行实时计算服务分享给大家~

03

大数据平台是否更应该容器化?

作者颜卫，腾讯高级后台开发工程师，专注于Kubernetes大规模集群管理和资源调度，有过万级集群的管理运维经验。目前负责腾讯云TKE大规模Kubernetes集群的大数据应用托管服务。

03

自建迁移EMR实践案例

自建开源大数据平台会随着企业数据的增长遇到：性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop对比优势、自建迁移上云的实践案例来介绍 EMR 是如何解决这些问题的。

自建大数据平台迁移腾讯云EMR最佳实践

自建开源大数据平台会随着企业数据的增长遇到：性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop对比优势、自建迁移上云的实践案例来介绍 EMR 是如何解决这些问题的。

02

Flink 实践教程-进阶（1）：维表关联

作者：腾讯云流计算 Oceanus 团队流计算 Oceanus 简介流计算 Oceanus 是大数据产品生态体系的实时化分析利器，是基于 Apache Flink 构建的具备一站开发、无缝连接、亚秒延时、低廉成本、安全稳定等特点的企业级实时大数据分析平台。流计算 Oceanus 以实现企业数据价值最大化为目标，加速企业实时化数字化的建设进程。本文将您详细介绍如何提取 MySQL 数据与 HBase 数据进行维表关联（流维 join），经过简单聚合分析后存入 Elasticsearch 中。前置准

02

五种常见云数据库的真实应用场景

随着客户上云的加快，客户越来越希望直接采用云上的数据库系统支撑业务发展，作为服务商来讲，了解云上的数据库的应用场景及常见特性成为必然。否则，将出现与客户交流困难，影响项目成效的麻烦事。今天我们讲五种常见的云数据库，这些内容也是在与客户沟通交流中的常见问题。

03

腾讯 JDK 正式开源，高性能、太牛逼啦！

Tencent Kona 是基于 OpenJDK8，由腾讯专业技术团队提供技术维护、优化及安全保障的 JDK 产品。腾讯的 Java 应用场景丰富，结合微服务、云原生应用、大数据等实际应用场景进行开发。Kona可为上述场景提供最优的 Java 生产环境及解决方案，并为开发者开发的 Java 应用提供平滑的迁移。目前，Kona为腾讯微服务平台 TSF、腾讯 TBDS 大数据套件、腾讯 TI 智能钛机器学习平台等提供了稳定保障。

03

基于腾讯云Oceanus实现MySQL和Hbase维表到数据仓库ClickHouse的实时分析

实时及未来，最近在腾讯云Oceanus进行实时计算服务，以下为mysql-cdc结合维表hbase到flink到ClickHouse的实践。分享给大家~

06

【云顾问-混沌】腾讯云的云上容灾实践

在2023年11月12日，刚经过双11的购物节大压力的阿里，却从17:44起发生了服务宕机，旗下的淘宝、闲鱼、饿了么等服务出现服务中断，甚至让高校学生宿舍的洗衣机都“宕机”了。从阿里云健康看板公布的数据可以看出，阿里云的几乎所有的云产品等服务都受到了影响，影响了全球范围内多个地域。阿里云这次故障，放在整个云厂商界都是炸裂般的存在。阿里云历时3个多小时，服务才陆续恢复。

07

视频直播：实时数据可视化分析

作者：spiderwu，腾讯 CSIG 高级工程师本文描述了如何在腾讯云上使用云化后大数据组件来完成实时分析系统的设计和实现，阅读过程中通过对比云 Ckafka、Flink 和 MySQL 等组件的使用差异来体现云化方案的优势。文中以视频直播礼物打赏的场景为例，展示全/半托管服务下开发的便利，便于读者对视频直播系统的设计有一个初步的了解。 1 解决方案描述 1.1 概述本方案结合腾讯云 CKafka、流计算 Oceanus、私有网络 VPC、商业智能分析 BI 等，对视频直播行业数字化运营进行实时可视

06

微服务云原生等场景，腾讯 Kona JDK 正式开源

Tencent Kona 是基于 OpenJDK8，由腾讯专业技术团队提供技术维护、优化及安全保障的 JDK 产品。腾讯的 Java 应用场景丰富，结合微服务、云原生应用、大数据等实际应用场景进行开发，并于11月5日正式发布了优化后的JDK——Tencent Kona。Kona可为上述场景提供最优的 Java 生产环境及解决方案，并为开发者开发的 Java 应用提供平滑的迁移。目前，Kona为腾讯微服务平台 TSF、腾讯 TBDS 大数据套件、腾讯 TI 智能钛机器学习平台等提供了稳定保障。 Ko

06

EMR入门学习之EMR初步介绍（一）

Elastic MapReduce（EMR）是腾讯云提供的云上 Hadoop 托管服务，提供了便捷的 Hadoop 集群部署、软件安装、配置修改、监控告警、弹性伸缩等功能，EMR部署在腾讯云平台（CVM）上，配合消息中间件、CDB等产品为企业提供了一套较为完善的大数据处理方案。如下图所示为EMR系统架构图：

01

腾讯云加速构建云原生数据仓库，助力企业数字化转型

在企业数字化转型的当下，数据仓库的云端构建成为主流趋势，Gartner 预测，到2023年全球3/4的数据库都会跑在云上。

01

腾讯云加速构建云原生数据仓库，助力企业数字化转型

在企业数字化转型的当下，数据仓库的云端构建成为主流趋势，Gartner 预测，到2023年全球3/4的数据库都会跑在云上。 12月20日，腾讯2020 Techo Park开发者大会大数据分论坛在北京召开。腾讯数据平台部数据中心技术总监于洋、腾讯云大数据首席产品架构师高廉墀以及腾讯云大数据团队 Ozone 项目技术负责人陈怡等嘉宾出席大会，并探讨了数据仓库的多元技术，聚焦云端数据仓库的热潮，展现腾讯数据仓库技术架构演进与未来发展。云原生数据仓库成为风口，助力解决企业数据仓库转型升级从企业数字化转型看，

02

CDP私有云7中的运营数据库性能改进

Cloudera数据平台（CDP）私有云是用于集成分析和数据管理的最全面的本地平台。它结合了Cloudera Enterprise Data Hub和Hortonworks Data Platform Enterprise Plus的优点，并为数据中心带来了用于数据管理和分析的最新最好的开源技术。

01

基于腾讯云数据库构建商品加工引擎，管理近10亿商品数据

商品加工引擎是腾讯基于云原生打造的高可用、可扩展、灵活配置的商品处理引擎，融合商品接入、商品加工、商品存储、商品分发、链路监控、商品对账等核心能力，支持近十亿的商品管理和加工，以及腾讯多个核心应用场景。商品加工引擎提供不同类型的商品录入、商品统一加工、商品信息分发等能力。存储商品数据接近十亿，支持商品加工能力包括：淫秽、色情、迷信、暴力、涉政等内容机器或人工审核，图片转链、视频转链、统一商品理解类目品牌词生成、统一商品标签生成、商品卖点信息生成等等。系统架构支持商品统一接入、商品基于自建的组件市场

02

EMR(弹性MapReduce)入门之kafka实战（十五）

Kafka是最初由Linkedin公司开发，是一个分布式、分区的、多副本的、多订阅者，基于zookeeper协调的分布式日志系统（也可以当做MQ系统），常见可以用于web/nginx日志、访问日志，消息服务等等，Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。

01

多图技术贴：深入浅出解析大数据平台架构

目录：什么是大数据 Hadoop介绍-HDFS、MR、Hbase 大数据平台应用举例-腾讯公司的大数据平台架构 “就像望远镜让我们能够感受宇宙，显微镜让我们能够观测微生物一样，大数据正在改变我们的

HBase数据导入工具总结

本文对HBase常用的数据导入工具进行介绍，并结合云HBase常见的导入场景，给出建议的迁移工具和参考资料。

03

缓慢但胜在稳健，HBase大势已成

【编者按】对比传统RDBMS领域，NoSQL界的厮杀显然更加激烈。而在这场没有硝烟的战场中，MongoDB和Cassandra无疑是风头最劲的两个产品。但是如果你着眼HBase，各大热门技术（比如Spark、Hadoop）及知名厂商（比如微软、Splice Machine）的支持无疑描绘出一个更美好的未来，下面我们一起看Gigaom Andrew带来的分析。以下为译文：在NoSQL数据库领域，统治产品无疑当属MongDB和DataStax Enterprise（一个领先的Apache Cassand

05

【观点】NoSQL市场两分格局是个伪命题, HBase有望后来居上

在NoSQL数据库领域，统治产品无疑当属MongDB和DataStax Enterprise（一个领先的Apache Cassandra发行版）。但近来MongoDB，甚至整个NoSQL数据库市场不断遭受IT业界质疑，认为“大数据时代NoSQL并非颠覆性技术”，MongoDB技术门槛不高，其市场正面临Teradata、MemSQL和Heroku的威胁。这使得很多潜在用户开始担心——MongoDB的成功是否建立在过度的炒作之下。在Mongo DB遭受质疑的同时, 媒体开始关注一个顽强，但

07

大数据和云计算技术周报（第34期）:NoSQL特辑

写在第34期到底什么是NoSQL?公众号一系列前菜，大家可以看看： NoSQL 还是 SQL ？这一篇讲清楚新数仓系列：Hbase周边生态梳理（1）新数仓系列：Hbase国内开发者生存现状（2）

07

将 HBase 迁移到 CDP

您可以将 Apache HBase 工作负载从 CDH 和 HDP 迁移到 CDP。要成功迁移 Apache HBase 工作负载，您必须首先了解两个平台之间的数据管理差异，并准备好源数据以与目标 CDP 平台兼容。

03

腾讯大数据套件带你玩转大数据

前言 ‍ 人类每一次大的技术变革都是先在新兴产业生根发芽，再慢慢把触角伸到传统行业。在当前这股由IT(Information Technology)向DT(Data Technology)转变的技术浪潮中，互联网行业成为云计算、大数据等高新技术的试验田。经过近十年的发展，随着大数据技术的不断成熟以及互联网应用案例的普及，"数据驱动业务"的模式逐渐得到各行各业的广泛认同，“互联网+”战略的提出更是为大数据从互联网向其他行业的传播吹来一阵东风。腾讯作为互联网企业的代表，早在09年就开始探索建设大数据平台，经过批

08

hbase迁移EMR实践

一、业务背景：业务方需要搭建一套hbase集群，数据来源是hive表。集群数据规模：每天4.5kw个key，420亿条左右数据，平均每个key每天1000个记录。每天总数据量1.2T左右，3备份需要存储2年约2.5P。为响应公司业务上云，通过腾讯云上EMR搭建hbase集群。hive集群是在IDC机房，和普通集群迁移相比，这涉及到跨机房、跨集群的数据迁移，以及hive表数据到hbase集群数据的转换。二、技术方案步骤 1、IDC机房与EMR网络的联通性验证

06

EMR之HBASE集群参数调优与压测

HBase 是Hadoop生态里重要一员。对HBase的调优，对节约成本，提升用户体验有重要意义。

06

跟着3306π走进腾讯云

瞧！现场的小伙伴都是在很认真的听讲呢，虽然外面飘着小雨（同时还出着太阳，四不四有点魔性），但是成都技术圈的学习热情，就好像成都辣椒一样火热的，提问根本停不下来啊~

04

WAL文件过多导致hbase master无法启动

近期腾讯云某家大客户的hbase master一直无法启动，经过仔细诊断之后发现是由于hbase的WAL文件非常多（达到15TB），导致hbase在zk的节点（存储WAL文件信息的节点）超过4096*1024 默认大小，无法正常提供服务。因此，hbase master无法正常启动。通过增加zk节点的大小参数，并且优化WAL文件，最终解决该问题。

04

大数据和云计算技术周报（第112期)

ClickHouse 优秀的读写处理性能，丰富强大的函数支持，以及灵活的 SQL 查询，支撑了微博广告监控系统的百亿流量请求和复杂业务需求。

03

运营数据库系列之管理篇

这篇博客文章是CDP中Cloudera的运营数据库（OpDB）系列文章的一部分。每篇文章都会详细介绍新功能。从该系列的开头开始，请参阅<CDP中的运营数据库>,<运营数据库系列之可访问性>。

01

hbase因为数据空洞故障导致读写缓慢

腾讯云某客户的开发者反馈，大数据集群的hbase读写非常缓慢。我们使用测试程序，也复现该问题。因此，我们需要对hbase集群进行全面检测。

09

降本30%，酷家乐海量数据冷热分离设计与实践

作者 | 王小波编辑 | 李忠良降本增效一直是研发团队追求的目标之一，面对不断上涨的数据量，研发侧开始思考如何在不降低用户体验的情况下进行成本压减，冷热数据分离的架构思想引起了我们的注意。背景定制家具业务是酷家乐最早的业务之一，定制家具的方案数据也同样沉淀了多年的数据；数据库从早期的 MongoDB 到切换到现在的 HBase；存储逻辑也从原来的全量保存演进到现在的分片增量保存。随着数据量不断增大，带来的是巨大的成本压力与运维难度，目前定制 HBase 集群仅单副本数据量接近 15

03

腾讯云大数据技术介绍-案例分享

前面几章说了腾讯云大数据技术介绍，分别介绍了：大数据的存储，大数据的使用，和实时并发数据处理。这是一套完整的体系，需要综合的来运用才能体现出商业化的最大价值。

2021年大数据Hadoop（三）：Hadoop国内外应用

Yahoo是Hadoop的最大支持者，Yahoo的Hadoop机器总节点数目已经超过42000个，有超过10万的核心CPU在运行Hadoop。最大的一个单Master节点集群有4500个节点（每个节点双路4核心CPUboxesw，4×1TB磁盘，16GBRAM）。总的集群存储容量大于350PB，每月提交的作业数目超过1000万个。

04

Hadoop，凉了？那还需要它吗？

近日，Hadoop 领域发生几件不太美好的事情，先是 MapR 宣布如果无法获得新的投资，就必须要裁员百余人，并关闭硅谷总部，再是 Cloudera 股价暴跌 43%，估值缩水。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭