首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    阿里之路(二)

    从今年7月到现在转眼间转岗到淘宝部门已经有小半年了,最近刚刚经历人生中第一次双11实战,体验了一把系统经受高并发高流量的冲击的感觉,一个字爽,作为小白,在这小半年里面收获颇多,一个感悟是实战是提高一个人能力的唯一真理,只有真的动手去做了,才会知道会遇到什么问题。日常做项目时候不怕遇到问题如何解决,最怕有些情景考虑不到,而后者是需要经验累积起来的,一方面是试错的累积,一方面是通过书本或者思考源码得来的。来淘宝这半年来为了能够学到更多,从来不敢浪费时间,一边欣赏这人家如何用代码解决高并发高流量问题,一边学着人家如何用工具快速高效的查询系统瓶颈与查找线上问题。

    02

    2021年大数据HBase(十四):HBase的原理及其相关的工作机制

    flush溢写流程:   hbase 2.0版本后的流程       随着客户端不断写入数据到达memStore中, memStore内存就会被写满(128M), 当memStore内存达到一定的阈值后, 此时就会触发flush刷新线程, 将数据最终写入HDFS上, 形成一个StoreFile文件 1) 当memStore的内存写满后, 首先将这个内存空间关闭, 然后开启一个新的memStore, 将这个写满内存空间的数据存储到一个pipeline的管道(队列)中 (只能读, 不能改) 2) 在Hbase的2.0版本后, 这个管道中数据, 会尽可能晚刷新到磁盘中, 一直存储在内存中,  随着memStore不断的溢写, 管道中数据也会不断的变多 3) 当管道中数据, 达到一定的阈值后, hbase就会启动一个flush的刷新线程, 对pipeline管道中数据一次性全部刷新到磁盘上,而且在刷新的过程中, 对管道中数据进行排序合并压缩操作, 在HDFS上形成一个合并后的storeFile文件

    02
    领券