mikealzhou

文章/答案/技术大牛

发布

LV1

发表了文章 2019-08-022019-08-02 18:15:01

20年通信&互联网&IT行业大变迁

本文转自：http://www.txrjy.com/thread-1082341-1-1.html

mikealzhou 2019-08-022019-08-02 18:27:00

关注了用户 2019-07-232019-07-23 16:30:25

harryxqfeng

腾讯云大数据解决方案架构师

0 文章0 回答10 关注者

关注了用户 2019-07-232019-07-23 16:30:22

洛杉矶

个人号：shenghuoquanlw3，公众号：shenghuoquanlwo

14 文章0 回答56 关注者

关注了用户 2019-07-232019-07-23 16:30:15

mikezou

大数据基础产品团队，T4技术专家

1 文章1 回答19 关注者

关注了用户 2019-07-232019-07-23 16:30:13

sundyxiong
腾讯｜高级开发工程师 (已认证)

腾讯云高级工程师

10 文章0 回答63 关注者

关注了用户 2019-07-232019-07-23 16:30:12

liubang01

6 文章0 回答43 关注者

关注了用户 2019-07-232019-07-23 16:29:53

wellgao

emr hadoop

1 文章0 回答5 关注者

关注了用户 2019-07-232019-07-23 16:28:57

袁宋
腾讯科技（深圳）有限公司｜大数据架构师 (已认证)

8 文章2 回答19 关注者

关注了用户 2019-07-232019-07-23 16:28:51

积极向上

0 文章0 回答28 关注者

关注了用户 2019-07-232019-07-23 16:28:35

傻二哥
腾讯｜高级工程师 (已认证)

腾讯云大数据高级工程师，十年大数据从业经验。

0 文章0 回答6 关注者

发表了文章 2019-05-182019-05-18 15:31:25

mapreduce报错：java.io.IOException: Split metadata size exceeded 10000000

客户在用hive sql做几张表的组合分析，使用mr引擎。因为其中有一张表超过5万个分区，数据总量超过8千亿条，因此运行过程中出现失败，报错如下所示：

mikealzhou 2019-05-182019-05-18 15:48:18

sql、hive、mapreduce

发表了文章 2019-03-152019-03-15 18:19:48

HDFS 线程参数DataXceiver 引发的故障

腾讯云大数据团队服务的某个大客户，hadoop集群超过300台服务器。因为大数据平台承载的业务程序非常多（每天超过5万次任务运行在yarn）、datanode的...

mikealzhou 2019-03-152019-03-15 18:19:48

yarn、node.js、linux、hive、大数据

发表了文章 2019-03-142019-03-14 16:05:51

hive export报错找不到DistCpOptions类

从上述报错，浏览社区没得到任何有价值的信息。通过查看hive的源码，也没有有效的信息。因此，我们需要查看hive的详细日志。

mikealzhou 2019-03-142019-03-14 16:05:51

hive、java、单片机、hadoop、面向对象编程

发表了文章 2019-03-102019-03-10 20:38:16

Hive万亿级表联合分析故障排查与优化过程

随着大数据技术日趋成熟，行业生态愈发完善，腾讯云大数据团队服务的大客户越来越多。在笔者服务的众多大客户之中，PB级海量数据已经成为常态。笔者负责大数据技术支持的...

mikealzhou 2019-03-112019-03-11 15:59:12

sql、yarn、node.js、大数据、hive

发表了文章 2018-12-262018-12-26 23:08:48

kafka增加topic的备份数量

本文将介绍如何利用kafka-reassign-partitions.sh命令增加主题的备份数量。

mikealzhou 2019-01-072019-01-07 15:13:27

kafka、bash、bash 指令

发表了文章 2018-12-192018-12-19 23:20:56

spark sql简单查询千亿级库表导致的问题

根据常理判断，简单的 select * limit 不会造成内存溢出的。因此，我们用hive原生sql查询，发现不存在这个问题。

mikealzhou 2018-12-192018-12-19 23:42:28

其他

发表了文章 2018-12-132018-12-13 23:10:52

TBDS大数据集群迁移实践总结

这次迁移算是TBDS集群的第一次完整迁移案例，包括用户的业务数据，平台应用，从项目启动到最后完成迁移差不多耗费了1个月的时间。

mikealzhou 2018-12-262018-12-26 23:26:33

大数据处理套件 TBDS、云数据迁移、迁移、数据库、云数据库 SQL Server

发表了文章 2018-10-292018-10-29 00:07:38

hbase因为数据空洞故障导致读写缓慢

腾讯云某客户的开发者反馈，大数据集群的hbase读写非常缓慢。我们使用测试程序，也复现该问题。因此，我们需要对hbase集群进行全面检测。

mikealzhou 2018-10-292018-10-29 11:10:37

https、ruby on rails、网络安全、大数据、hbase

发表了文章 2018-10-102018-10-10 22:54:03

WAL文件过多导致hbase master无法启动

近期腾讯云某家大客户的hbase master一直无法启动，经过仔细诊断之后发现是由于hbase的WAL文件非常多（达到15TB），导致hbase在zk的...

mikealzhou 2018-10-102018-10-10 22:54:54

hbase、TDSQL MySQL 版、bash、bash 指令、存储

预约了直播 2018-09-302018-09-30 21:37:23

极客说第二期--新一代大数据技术：构建PB级云端数仓实践

2018-10-18回顾中

12 下一页

个人简介

大数据和数据中台架构师
暂未填写个人简介
大数据机器学习数据挖掘数据分析
电子科技大学
https://cloud.tencent.com/developer/user/1242474
四川省 | 成都市
加入社区时间：2018-01-19

个人成就

获得 160 次赞同
文章被阅读 146.1K 次
文章获得 4 次首页推荐

关注了：9关注者：225

mikealzhou

20年通信&互联网&IT行业大变迁

harryxqfeng

洛杉矶

mikezou

sundyxiong
腾讯｜高级开发工程师 (已认证)

liubang01

wellgao

袁宋
腾讯科技（深圳）有限公司｜大数据架构师 (已认证)

积极向上

傻二哥
腾讯｜高级工程师 (已认证)

mapreduce报错：java.io.IOException: Split metadata size exceeded 10000000

HDFS 线程参数DataXceiver 引发的故障

hive export报错找不到DistCpOptions类

Hive万亿级表联合分析故障排查与优化过程

kafka增加topic的备份数量

spark sql简单查询千亿级库表导致的问题

TBDS大数据集群迁移实践总结

hbase因为数据空洞故障导致读写缓慢

WAL文件过多导致hbase master无法启动

极客说第二期--新一代大数据技术：构建PB级云端数仓实践

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

mikealzhou

20年通信&互联网&IT行业大变迁

harryxqfeng

洛杉矶

mikezou

sundyxiong腾讯 ｜ 高级开发工程师 (已认证)

liubang01

wellgao

袁宋腾讯科技（深圳）有限公司 ｜ 大数据架构师 (已认证)

积极向上

傻二哥腾讯 ｜ 高级工程师 (已认证)

mapreduce报错：java.io.IOException: Split metadata size exceeded 10000000

HDFS 线程参数DataXceiver 引发的故障

hive export报错找不到DistCpOptions类

Hive万亿级表联合分析故障排查与优化过程

kafka增加topic的备份数量

spark sql简单查询千亿级库表导致的问题

TBDS大数据集群迁移实践总结

hbase因为数据空洞故障导致读写缓慢

WAL文件过多导致hbase master无法启动

极客说第二期--新一代大数据技术：构建PB级云端数仓实践

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

sundyxiong
腾讯｜高级开发工程师 (已认证)

袁宋
腾讯科技（深圳）有限公司｜大数据架构师 (已认证)

傻二哥
腾讯｜高级工程师 (已认证)