红黑树是数据结构中比较复杂的一种,最近与它交集颇多,于是花了一周的空闲时间跟它死磕,终于弄明白并实现了红黑树。写文总结一下,希望能给试图理解红黑树的同学一些灵感,也让我能记得更深刻。
在研究红黑树时吃了不少苦头,原因有二:
双黑、caseN
法,而插入和删除的情况很多,每种都有对应的处理方式,如果死记硬背的话,再过一段时间再回忆各种情况可能就一头雾水了。网络上讲红黑树的实现多来源于《算法导论》一书,直接讲红黑树的实现,需要处理颜色和高度两种属性约束,比较晦涩。本文通过红黑树的等同—— 2-3-4树,避开颜色属性约束,也弱化了高度的影响,以另一种方式去理解红黑树,虽然并不能完全降低它的复杂度,但自认为较之普遍实现,更易记一些。
文章最前面先放上红黑树的实现源码,代码在 Github 上,一开始实现时使用我最熟练的 PHP,后续添加了 Java 版,代码都可以直接运行。源码链接:GitHub-枕边书-RBTree
,欢迎star
。
文章欢迎转载,请注明出处:http://www.cnblogs.com/zhenbianshu/p/8185345.html。
红黑树是一种结点带有颜色属性的二叉查找树,但它在二叉查找树之外,还有以下要求:
下图就是一个典型的红黑树:
但实现上我省略了其中的 Nil 结点,一般如下图,大家理解时也可以忽略它们。
我们知道二叉查找树在不停地添加或删除结点后,可能会导致结点情况如下:
这种情况下,二叉查找树的查找效率最坏会降低为 O(n)
。
而红黑树由于在插入和删除结点时都会进行变色旋转等操作,在符合红黑树条件的情况下,即使一边子树全是黑色结点,另一边子树全是红黑相间,两子树的高度差也不会超过一半。一棵有 n 个结点的红黑树高度至多为 2log(n+1)
,查找效率最坏为 O(log(n))
。
所以红黑树常被用于需求查找效率稳定的场景,如 Linux 中内核使用它管理内存区域对象、Java8 中 HashMap 的实现等,所以了解红黑树也很有意义。
下面介绍一下红黑树的等同 2-3-4树。
2-3-4树是四阶的 B树(Balance Tree),它的结构有以下限制:
下图是一个典型的 2-3-4树(来自维基百科):
2-3-4树的查询操作像普通的二叉搜索树一样,非常简单,但由于其结点元素数不确定,在一些编程语言中实现起来并不方便,实现一般使用它的等同——红黑树。
至于为什么说红黑树是 2-3-4树的一种等同呢,这是因为 2-3-4树的每一个结点都对应红黑树的一种结构,所以每一棵 2-3-4树也都对应一棵红黑树,下图是 2-3-4树不同结点与红黑树子树的对应。
而上文中的 2-3-4树也可以转换成一棵红黑树:
由红黑树的性质5,和 2-3-4树的性质1,为了便于理解红黑树和 2-3-4树的对应关系,我们可以把红黑树从根结点到叶子结点的黑色结点个数定义为高度
。
红黑树和 2-3-4树的结点添加和删除都有一个基本规则:避免子树高度变化,因为无论是 2-3-4树还是红黑树,一旦子树高度有变动,势必会影响其他子树进行调整,所以我们在插入和删除结点时尽量通过子树内部调整来达到平衡,2-3-4树实现平衡是通过结点的旋转和结点元素数变化,红黑树是通过结点旋转和变色。
下面来对照着 2-3-4树说一下红黑树结点的添加和删除:
2-3-4树中结点添加需要遵守以下规则:
而将这些规则对应到红黑树里,就是:
红色
,这样才可能不会对红黑树的高度产生影响。黑+红
子树,插入后将其修复成 红+黑+红
子树(对应 3-结点升元);红+黑+红
子树,插入后将其修复成红色祖父+黑色父叔+红色孩子
子树,然后再把祖父结点当成新插入的红色结点递归向上层修复,直至修复成功或遇到 root 结点;如上图所示,虽然向红黑树中插入了一个新结点,但由于旋转和变色,子树的高度保持不变。
红黑树的删除要比插入要复杂一些,我们还是类比 2-3-4树来讲:
将这些规则对应到红黑树中即:
替代结点
(左子树的最右结点或右子树的最左结点都能保证替换后保证二叉查找树的结点的排序性质,叶子结点的替代结点是自身)替换掉被删除结点,从替代的叶子结点向上递归修复;父结点当作替代结点
递归向上处理。如上图,删除的要点是 找到替代结点
,如果替代结点是黑色,递归向上依次判断侄子结点、父结点是否可以补充被删除的黑色,整体思想就是将删除一个黑色结点造成的影响局限在子树内处理。
当然实现过程中调试也占了很大一部分,我使用了两项方法帮助调试:
debug
属性,用二分法设置此属性来找到问题结点;printTree()
方法,实时打印树结构,确定代码问题再分析;由于红黑树相对其他树实在较为复杂,只通过思考就完全理解不太现实,还需要自己去试着画,试着实现,我画了 5 张 A4 纸的正反面才算理解了红黑树,即便如此,在写这篇文章时还发现了代码中的可优化点。
而且代码实现比画图还略复杂,理论中的一个旋转
就包含了 左旋/右旋/先左旋再右旋/先右旋再左旋
几种情况,虽然有一定规律,还是自己实现一下印象最深刻。
关于本文有什么问题可以在下面留言交流,如果您觉得本文对您有帮助,可以点击下面的 推荐
支持一下我,博客一直在更新,欢迎 关注
。