mikealzhou - 个人中心 - 腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

mikealzhou

LV1

全部文章

20年通信&互联网&IT行业大变迁
本文转自：http://www.txrjy.com/thread-1082341-1-1.html
mikealzhou 2019-08-022019-08-02 18:15:01
5g
mapreduce报错：java.io.IOException: Split metadata size exceeded 10000000
客户在用hive sql做几张表的组合分析，使用mr引擎。因为其中有一张表超过5万个分区，数据总量超过8千亿条，因此运行过程中出现失败，报错如下所示：
mikealzhou 2019-05-182019-05-18 15:31:25
sql、hive、mapreduce
HDFS 线程参数DataXceiver 引发的故障
腾讯云大数据团队服务的某个大客户，hadoop集群超过300台服务器。因为大数据平台承载的业务程序非常多（每天超过5万次任务运行在yarn）、datanode的...
mikealzhou 2019-03-152019-03-15 18:19:48
yarn、node.js、linux、hive、大数据
hive export报错找不到DistCpOptions类
从上述报错，浏览社区没得到任何有价值的信息。通过查看hive的源码，也没有有效的信息。因此，我们需要查看hive的详细日志。
mikealzhou 2019-03-142019-03-14 16:05:51
hive、java、单片机、hadoop、面向对象编程
Hive万亿级表联合分析故障排查与优化过程
随着大数据技术日趋成熟，行业生态愈发完善，腾讯云大数据团队服务的大客户越来越多。在笔者服务的众多大客户之中，PB级海量数据已经成为常态。笔者负责大数据技术支持的...
mikealzhou 2019-03-102019-03-10 20:38:16
sql、yarn、node.js、大数据、hive
kafka增加topic的备份数量
本文将介绍如何利用kafka-reassign-partitions.sh命令增加主题的备份数量。
mikealzhou 2018-12-262018-12-26 23:08:48
kafka、bash、bash 指令
TBDS大数据集群迁移实践总结
这次迁移算是TBDS集群的第一次完整迁移案例，包括用户的业务数据，平台应用，从项目启动到最后完成迁移差不多耗费了1个月的时间。
mikealzhou 2018-12-132018-12-13 23:10:52
大数据处理套件 TBDS、云数据迁移、迁移、数据库、云数据库 SQL Server
spark sql简单查询千亿级库表导致的问题
根据常理判断，简单的 select * limit 不会造成内存溢出的。因此，我们用hive原生sql查询，发现不存在这个问题。
mikealzhou 2018-12-192018-12-19 23:20:56
其他
hbase因为数据空洞故障导致读写缓慢
腾讯云某客户的开发者反馈，大数据集群的hbase读写非常缓慢。我们使用测试程序，也复现该问题。因此，我们需要对hbase集群进行全面检测。
mikealzhou 2018-10-292018-10-29 00:07:38
https、ruby on rails、网络安全、大数据、hbase
WAL文件过多导致hbase master无法启动
近期腾讯云某家大客户的hbase master一直无法启动，经过仔细诊断之后发现是由于hbase的WAL文件非常多（达到15TB），导致hbase在zk的...
mikealzhou 2018-10-102018-10-10 22:54:03
hbase、TDSQL MySQL 版、bash、bash 指令、存储
Hiveserver2 性能优化与GC优化
最近发现hiveserver2（本质上是提供jdbc连接的driver进程）经常发生严重卡死故障，而且卡死分成两种现象。
mikealzhou 2018-06-192018-06-19 20:39:44
hive、jdbc、spark
kafka如何彻底删除topic及数据
删除kafka topic及其数据，严格来说并不是很难的操作。但是，往往给kafka 使用者带来诸多问题。项目组之前接触过多个开发者，发现都会偶然出现无法彻底删...
mikealzhou 2018-05-192018-05-19 23:43:50
zookeeper、存储
Regionserver频繁挂掉故障处理实践
近期腾讯云的一家大客户频繁出现HBase regionserver 挂掉，影响业务正常使用。通过调整堆栈大小、gc优化、超时时间等都无法解决该问题。经过细致并综...
mikealzhou 2018-01-282018-01-28 19:07:29
hbase
kafka数据迁移实践
本文重点介绍 kafka 的两类常见数据迁移方式：1、broker 内部不同数据盘之间的分区数据迁移；2、不同 broker 之间的分区数据迁移。
mikealzhou 2018-01-192018-01-19 19:21:14
数据迁移
利用Flume 汇入数据到HBase：Flume-hbase-sink 使用方法详解
本文作者将会详细描述这两大类HBaseSinks 对应的三种序列化模式的使用方法。
mikealzhou 2018-01-202018-01-20 22:49:04
hbase、apache
Flume-Hbase-Sink针对不同版本flume与HBase的适配研究与经验总结
导语：本文细致而全面地讲解使用flume输出数据到HBase的三种不同 Flume-Hbase-Sink 之间的差异性，以及技术细节。并且透彻而全面地总结了不同...
mikealzhou 2018-01-202018-01-20 22:43:52
apache、hbase
Hive 时间转换函数使用心得
Hive sql 与传统的 oracle 或者mysql 的时间转换函数有一些不同，对于想将传统数据库迁移到hdfs 用 hive sql 进行处理的任务，如何...
mikealzhou 2018-01-202018-01-20 22:34:45
hive、oracle、云数据库 SQL Server、数据库
HDFS 2.x 磁盘间数据均衡的一种可行办法
当HDFS的datanode节点挂载多个磁盘时，往往会出现两种数据不均衡的情况：
mikealzhou 2018-01-192018-01-19 19:29:46
hadoop

个人简介

大数据和数据中台架构师
暂未填写个人简介
大数据机器学习数据挖掘数据分析
电子科技大学
https://cloud.tencent.com/developer/user/1242474
四川省 | 成都市
加入社区时间：2018-01-19

个人成就

获得 160 次赞同
文章被阅读 146.1K 次
文章获得 4 次首页推荐

关注了：9关注者：225