首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >深入解析红黑树:高效平衡的艺术

深入解析红黑树:高效平衡的艺术

作者头像
用户11915063
发布2025-11-20 13:20:59
发布2025-11-20 13:20:59
50
举报

前言:

本文将从红黑树的核心定义与规则出发,拆解其插入、删除过程中的平衡调整逻辑,结合 C++ 的语法特性(如类模板、指针操作)分析实现细节,并探讨其在 STL 容器中的具体应用,帮助读者既能掌握红黑树的理论原理,也能具备实际编码与问题分析的能力


一、初步了解红黑树

1.1 红黑树的概念

红黑树是一棵二叉搜索树,他的每个结点增加一个存储位来表示结点的颜色,可以是红色或者黑色。通过对任何一条从根到叶子的路径上各个结点的颜色进行约束,红黑树确保没有一条路径会比其他路径长出 2 倍,因而是接近平衡的。

思考:红黑树插入算法复杂度为?

答案:O(logN) 解析:由于红黑树是接近平衡的,所以插入时最坏的情况就是遍历到最后一个数字,也就是红黑树的高度

1.2 红黑树规则
  1. 每个结点不是红色就是黑色
  2. 根结点是黑色的
  3. 如果一个结点是红色的,则它的两个孩子结点必须是黑色的,也就是说任意一条路径不会有连续的红色结点
  4. 对于任意一个结点,从该结点到其所有 NULL 结点的简单路径上,均包含相同数量的黑色结点

结合图例,我们可以更好地理解红黑树规则:

1.3 红黑树的路径

给大家放张图片,大家来分析一下这颗红黑树有几条路径?

两条?当然不对,再仔细想一想?

好了,不卖关子了,答案是 :6条

我给大家画张图,大家就理解了:

NIL是什么东西?

NIL就相当于NULL一样,代表空节点,红黑树的路径与其他二叉树的路径不同,红黑树的路径是走到节点为空的孩子节点,所以,这里的路径就有6条(说明:《算法导论》等书籍上补充了一条每个叶子结点 (NIL) 都是黑色的规则。他这里所指的叶子结点不是传统的意义上的叶子结点,而是我们说的空结点,有些书籍上也把 NIL 叫做外部结点。NIL 是为了方便准确的标识出所有路径,《算法导论》在后续讲解实现的细节中也忽略了 NIL 结点,所以我们知道一下这个概念即可)

1.3.1 思考一下,红黑树如何确保最长路径不超过最短路径的 2 倍的?
  • 由规则 4 可知,从根到 NULL 结点的每条路径都有相同数量的黑色结点,所以极端场景下,最短路径就是全是黑色结点的路径,假设最短路径长度为 bh (black height)
  • 由规则 2 和规则 3 可知,任意一条路径不会有连续的红色结点,所以极端场景下,最长的路径就是一黑一红间隔组成,那么最长路径的长度为 2*bh
  • 综合红黑树的 4 点规则而言,理论上的全黑最短路径和一黑一红的最长路径并不是在每棵红黑树都存在的。假设任意一条从根到 NULL 结点路径的长度为 x,那么 bh <= h <= 2*bh
1.4 红黑树的效率:

二、红黑树基本逻辑

2.1 基本结构的实现

颜色的枚举:

结构的实现:

2.2 插入逻辑以及代码实现
2.2.1 红黑树树插入一个值的大概过程
  1. 插入一个值按二叉搜索树规则进行插入,插入后我们只需要观察是否符合红黑树的 4 条规则。
  2. 如果是空树插入,新增结点是黑色结点。如果是非空树插入,新增结点必须红色结点,因为非空树插入,新增黑色结点就破坏了规则 4,规则 4 是很难维护的。
  3. 非空树插入后,新增结点必须红色结点,如果父亲结点是黑色的,则没有违反任何规则,插入结束
  4. 非空树插入后,新增结点必须红色结点,如果父亲结点是红色的,则违反规则 3。进一步分析,c 是红色,p 为红,g 必为黑,这三个颜色都固定了,关键的变化看 u 的情况,需要根据 u 分为以下几种情况分别处理

说明:说明:下图中假设我们把新增结点标识为 c (cur),c 的父亲标识为 p (parent),p 的父亲标识为 g (grandfather),p 的兄弟标识为 u (uncle)

2.2.2 三种情况分析:
1. 情况 1:变色

c 为红,p 为红,g 为黑,u 存在且为红,则将 p 和 u 变黑,g 变红。在把 g 当做新的 c,继续往上更新。

分析:因为 p 和 u 都是红色,g 是黑色,把 p 和 u 变黑,左边子树路径各增加一个黑色结点,g 再变红,相当于保持 g 所在子树的黑色结点的数量不变,同时解决了 c 和 p 连续红色结点的问题,需要继续往上更新是因为,g 是红色,如果 g 的父亲还是红色,那么就还需要继续处理;如果 g 的父亲是黑色,则处理结束了;如果 g 就是整棵树的根,再把 g 变回黑色。

情况 1 只变色,不旋转。所以无论 c 是 p 的左还是右,p 是 g 的左还是右,都是上面的变色处理方式

如下图:将以上类似的处理进行了抽象表达,d/e/f代表每条路径拥有hb个黑色结点的子树,a/b代表每条路径拥有hb-1个黑色结点的根为红的子树,hb>=0

下面分别展示了hb == 0/hb == 1/hb == 2的具体情况组合分析,当hb等于2时,这里组合情况上百亿种,这些样例是帮助我们理解,不论情况多少种,多么复杂,处理方式一样的,变色再继续往上处理即可,所以我们只需要看抽象图即可

2. 情况 2:单旋 + 变色

c 为红,p 为红,g 为黑,u 不存在或者 u 存在且为黑,u 不存在,则 c 一定是新增结点,u 存在且为黑,则 c 一定不是新增,c 之前是黑色的,是在 c 的子树中插入,符合情况 1,变色将 c 从黑色变成红色,更新上来的

分析:p 必须变黑,才能解决,连续红色结点的问题,u 不存在或者是黑色的,这里单纯的变色无法解决问题,需要旋转 + 变色

p 是 g 的左的情况:c 是 p 的左,那么以 g 为旋转点进行右单旋,再把 p 变黑,g 变红即可。p 变成这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为 p 的父亲是黑色还是红色或者空都不违反规则

p 是 g 的右的情况:c 是 p 的右,那么以 g 为旋转点进行左单旋,再把 p 变黑,g 变红即可。p 变成这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为 p 的父亲是黑色还是红色或者空都不违反规则

3. 情况 3:双旋 + 变色

c 为红,p 为红,g 为黑,u 不存在或者 u 存在且为黑,u 不存在,则 c 一定是新增结点,u 存在且为黑,则 c 一定不是新增,c 之前是黑色的,是在 c 的子树中插入,符合情况 1,变色将 c 从黑色变成红色,更新上来的

分析:p 必须变黑,才能解决,连续红色结点的问题,u 不存在或者是黑色的,这里单纯的变色无法解决问题,需要旋转 + 变色

p 是 g 的左的情况:如果 p 是 g 的左,c 是 p 的右,那么先以 p 为旋转点进行左单旋,再以 g 为旋转点进行右单旋,再把 c 变黑,g 变红即可。c 变成这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为 c 的父亲是黑色还是红色或者空都不违反规则

p 是 g 的右的情况:c 是 p 的左,那么先以 p 为旋转点进行右单旋,再以 g 为旋转点进行左单旋,再把 c 变黑,g 变红即可。c 变成这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为 c 的父亲是黑色还是红色或者空都不违反规则

插入代码实现:
代码语言:javascript
复制
bool Insert(const pair<K, V>& kv)
{
	if (_root == nullptr)
	{
		_root = new Node(kv);
		_root->_col = BLACK;
		return true;
	}

	Node* parent = nullptr;
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < kv.first)
		{
			parent = cur;
			cur = cur->_right;
		}
		else if (cur->_kv.first > kv.first)
		{
			parent = cur;
			cur = cur->_left;
		}
		else
		{
			return false;
		}
	}

	//新增红色
	cur = new Node(kv);
	cur->_col = RED;
	if (parent->_kv.first < kv.first)
	{
		parent->_right = cur;
	}
	else
	{
		parent->_left = cur;
	}
	cur->_parent = parent;

	while (parent && parent->_col == RED)
	{
		Node* grandfather = parent->_parent;
		//父亲是爷爷的左边
		if (grandfather->_left == parent)
		{
			//    g
			//  p   u
			//c
			Node* uncle = grandfather->_right;
			// 叔叔存在且为红色
			if (uncle && uncle->_col == RED)
			{
				// 变色+继续往上处理
				parent->_col = uncle->_col = BLACK;
				grandfather->_col = RED;

				cur = grandfather;
				parent = cur->_parent;
			}
			else // 叔叔不存在或者叔叔存在且为黑
			{
				//      g
				//   p     u
				// c
				//单旋+变色
				if (cur == parent->_left)
				{
					RotateR(grandfather);

					parent->_col = BLACK;
					grandfather->_col = RED;
				}
				//双旋+变色
				else
				{
					//      g
					//   p     u
					//      c
					RotateL(parent);
					RotateR(grandfather);

					cur->_col = BLACK;
					grandfather->_col = RED;
				}
				break;
			}
		}
		//父亲是爷爷的右边
		else
		{
			Node* uncle = grandfather->_left;
			// 叔叔存在且为红色
			if (uncle && uncle->_col == RED)
			{
				// 变色+继续往上处理
				parent->_col = uncle->_col = BLACK;
				grandfather->_col = RED;
				//往上处理
				cur = grandfather;
				parent = cur->_parent;
			}
			//叔叔不存在或者叔叔存在且为黑
			else
			{
				//      g
				//   u     p
				//            c
				//单旋+变色
				if (cur == parent->_right)
				{
					RotateL(grandfather);
					grandfather->_col = RED;
					parent->_col = BLACK;
				}
				//双旋+变色
				else
				{
					//     g
					// u      p
					//     c
					RotateR(parent);
					RotateL(grandfather);

					cur->_col = BLACK;
					grandfather->_col = RED;
				}
				break;
			}
		}
	}

	_root->_col = BLACK;

	return true;
}
查找代码实现:
代码语言:javascript
复制
Node* Find(const K& key)
{
	Node* cur = _root;
	while (cur)
	{
		if (cur->_kv.first < key)
		{
			cur = cur->_right;
		}
		else if (cur->_kv.first > key)
		{
			cur = cur->_left;
		}
		else
		{
			return cur;
		}
	}
size()接口实现

这里实现size()几口就遇到难题了,我们该怎样呢?如果在私有内部,我们就不需要传根,如果在共有呢?根是私有的,我们调用不了根,所以此时就需要调用内部size()接口

public:
代码语言:javascript
复制
public:
    int Size() { return _Size(_root); }   
    int Height() { return _Height(_root); } 
private:
代码语言:javascript
复制
private:
    int _Size(Node* root) {  
        if (root == nullptr) return 0;
        return _Size(root->_left) + _Size(root->_right) + 1;  // 递归调用
    }
双接口版:
Height()接口实现

private:

public:

InOrder()接口实现

private:

public:

三、红黑树的检查

这里获取最长路径和最短路径,检查最长路径不超过最短路径的 2 倍是不可行的,因为就算满足这个条件,红黑树也可能颜色不满足规则,当前暂时没出问题,后续继续插入还是会出问题的。所以我们还是去检查 4 点规则,满足这 4 点规则,一定能保证最长路径不超过最短路径的 2 倍

  1. 规则 1 枚举颜色类型,天然实现保证了颜色不是黑色就是红色。
  2. 规则 2 直接检查根即可
  3. 规则 3 前序遍历检查,遇到红色结点查孩子不太方便,因为孩子有两个,且不一定存在,反过来检查父亲的颜色就方便多了。
  4. 规则 4 前序遍历,遍历过程中用形参记录跟到当前结点的 blackNum (黑色结点数量),前序遍历遇到黑色结点就 ++blackNum,走到空就计算出了一条路径的黑色结点数量。再任意一条路径黑色结点数量作为参考值,依次比较即可。
CheckColour()接口实现

private:

public:


四、完整代码

RBTree.h:
代码语言:javascript
复制
#include<assert.h>

//枚举颜色
enum Colour
{
	RED,
	BLACK
};

// red black tree
template<class K, class V>
struct RBTreeNode
{
	pair<K, V> _kv;
	RBTreeNode<K, V>* _left;
	RBTreeNode<K, V>* _right;
	RBTreeNode<K, V>* _parent;
	Colour _col;

	RBTreeNode(const pair<K, V>& kv)
		:_kv(kv)
		, _left(nullptr)
		, _right(nullptr)
		, _parent(nullptr)
		, _col(RED)
	{ }
};

template<class K, class V>
struct RBTree
{
	typedef RBTreeNode<K, V> Node;
public:
	bool Insert(const pair<K, V>& kv)
	{
		if (_root == nullptr)
		{
			_root = new Node(kv);
			_root->_col = BLACK;
			return true;
		}

		Node* parent = nullptr;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < kv.first)
			{
				parent = cur;
				cur = cur->_right;
			}
			else if (cur->_kv.first > kv.first)
			{
				parent = cur;
				cur = cur->_left;
			}
			else
			{
				return false;
			}
		}

		//新增红色
		cur = new Node(kv);
		cur->_col = RED;
		if (parent->_kv.first < kv.first)
		{
			parent->_right = cur;
		}
		else
		{
			parent->_left = cur;
		}
		cur->_parent = parent;

		while (parent && parent->_col == RED)
		{
			Node* grandfather = parent->_parent;
			//父亲是爷爷的左边
			if (grandfather->_left == parent)
			{
				//    g
				//  p   u
				//c
				Node* uncle = grandfather->_right;
				// 叔叔存在且为红色
				if (uncle && uncle->_col == RED)
				{
					// 变色+继续往上处理
					parent->_col = uncle->_col = BLACK;
					grandfather->_col = RED;

					cur = grandfather;
					parent = cur->_parent;
				}
				else // 叔叔不存在或者叔叔存在且为黑
				{
					//      g
					//   p     u
					// c
					//单旋+变色
					if (cur == parent->_left)
					{
						RotateR(grandfather);

						parent->_col = BLACK;
						grandfather->_col = RED;
					}
					//双旋+变色
					else
					{
						//      g
						//   p     u
						//      c
						RotateL(parent);
						RotateR(grandfather);

						cur->_col = BLACK;
						grandfather->_col = RED;
					}
					break;
				}
			}
			//父亲是爷爷的右边
			else
			{
				Node* uncle = grandfather->_left;
				// 叔叔存在且为红色
				if (uncle && uncle->_col == RED)
				{
					// 变色+继续往上处理
					parent->_col = uncle->_col = BLACK;
					grandfather->_col = RED;
					//往上处理
					cur = grandfather;
					parent = cur->_parent;
				}
				//叔叔不存在或者叔叔存在且为黑
				else
				{
					//      g
					//   u     p
					//            c
					//单旋+变色
					if (cur == parent->_right)
					{
						RotateL(grandfather);
						grandfather->_col = RED;
						parent->_col = BLACK;
					}
					//双旋+变色
					else
					{
						//     g
						// u      p
						//     c
						RotateR(parent);
						RotateL(grandfather);

						cur->_col = BLACK;
						grandfather->_col = RED;
					}
					break;
				}
			}
		}

		_root->_col = BLACK;

		return true;
	}

	void RotateR(Node* parent)
	{
		Node* subL = parent->_left;
		Node* subLR = subL->_right;

		parent->_left = subLR;
		if (subLR)
			subLR->_parent = parent;

		Node* parentParent = parent->_parent;

		subL->_right = parent;
		parent->_parent = subL;

		if (parent == _root)
		{
			_root = subL;
			subL->_parent = nullptr;
		}
		else
		{
			if (parentParent->_left == parent)
			{
				parentParent->_left = subL;
			}
			else
			{
				parentParent->_right = subL;
			}
			subL->_parent = parentParent;
		}
	}

	void RotateL(Node* parent)
	{
		Node* subR = parent->_right;
		Node* subRL = subR->_left;
		parent->_right = subRL;
		if (subRL)
			subRL->_parent = parent;
		Node* parentParent = parent->_parent;
		subR->_left = parent;
		parent->_parent = subR;
		if (parentParent == nullptr)
		{
			_root = subR;
			subR->_parent = nullptr;
		}
		else
		{
			if (parent == parentParent->_left)
			{
				parentParent->_left = subR;
			}
			else
			{
				parentParent->_right = subR;
			}
			subR->_parent = parentParent;
		}
	}


	void InOrder()
	{
		_InOrder(_root);
		cout << endl;
	}

	Node* Find(const K& key)
	{
		Node* cur = _root;
		while (cur)
		{
			if (cur->_kv.first < key)
			{
				cur = cur->_right;
			}
			else if (cur->_kv.first > key)
			{
				cur = cur->_left;
			}
			else
			{
				return cur;
			}
		}

		return nullptr;
	}

	bool CheckColour()
	{
		if (_root && _root->_col == RED)
			return false;
		
		//最左路径的黑色节点的数量做参考去比较其他路径
		int left_bn = 0;
		Node* cur = _root;
		while (cur)
		{
			if (cur->_col == BLACK)
				left_bn++;

			cur = cur->_left;
		}
		return _CheckColour(_root,0, left_bn);
	}

	int Height()
	{
		return _Height(_root);
	}

	int Size()
	{
		return _Size(_root);
	}
private:
	int _Size(Node* root)
	{
		if (root == nullptr)
			return 0;

		return _Size(root->_left) + _Size(root->_right) + 1;
	}

	int _Height(Node* root)
	{
		if (root == nullptr)
			return 0;
		int leftHeight = _Height(root->_left);
		int rightHeight = _Height(root->_right);
		return leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
	}
	//root_cur_bn从根节点到当前节点路径上黑色节点的数量
	//前序递归
	bool _CheckColour(Node* root,int root_cur_bn,const int left_bn)
	{
		if (root == nullptr)
		{
			//检查每条路径的黑色节点
			if (root_cur_bn != left_bn)
			{
				return false;
			}

			return true;
		}
		if (root->_col == BLACK)
		{
			root_cur_bn++; 
		}
		//检查连续的红色节点
		if (root->_col == RED && root->_parent && root->_parent->_col == RED)
		{
			return false;
		}
		return _CheckColour(root->_left, root_cur_bn,left_bn)
			&& _CheckColour(root->_right, root_cur_bn,left_bn);
	}

	void _InOrder(Node* root)
	{
		if (root == nullptr)
			return;

		_InOrder(root->_left);
		cout << root->_kv.first << ":" << root->_kv.second << endl;
		_InOrder(root->_right);
	}

private:
	Node* _root = nullptr;
};
Test.cpp:
代码语言:javascript
复制
#include<iostream>
#include<vector>
using namespace std;
#include"RBTree.h"

void testRBTree1()
{
	RBTree<int, int> t;
	// 常规的测试⽤例
	int a[] = { 16, 3, 7, 11, 9, 26, 18, 14, 15 };
	// 特殊的带有双旋场景的测试⽤例
	//int a[] = { 4, 2, 6, 1, 3, 5, 15, 7, 16, 14 };
	for (auto e : a)
	{
		t.Insert({ e, e });
	}
	t.InOrder();
	cout << t.CheckColour() << endl;
}

void testRBTree2()
{
	const int N = 100000;
	vector<int> v;
	v.reserve(N);
	srand(time(0));
	for (size_t i = 0; i < N; i++)
	{
		v.push_back(rand() + i);
	}
	size_t begin2 = clock();
	RBTree<int, int> t;
	for (auto e : v)
	{
		t.Insert(make_pair(e, e));
	}
	size_t end2 = clock();
	cout << "Insert:" << end2 - begin2 << endl;
	cout << t.CheckColour() << endl;
	cout << "Height:" << t.Height() << endl;
	cout << "Size:" << t.Size() << endl;
	size_t begin1 = clock();

	// 确定在的值
	for (auto e : v)
	{
		t.Find(e);
	}
	// 随机值
	for (size_t i = 0; i < N; i++)
	{
		t.Find((rand() + i));
	}
	size_t end1 = clock();
	cout << "Find:" << end1 - begin1 << endl;
}

int main()
{
	//testAVLTree1();
	testRBTree1();
	return 0;
}
void testRBTree1()测试结果:
void testRBTree2()测试结果:

结尾:

往期回顾:

AVL树:从原理到代码的完整解析

总结:数据结构的学习本质是 “理解问题 - 设计方案 - 权衡优劣” 的过程,红黑树正是这一过程的典型范例。希望本文能为读者打开深入学习的大门,在后续的实践中不断深化对自平衡树的理解,真正将理论转化为解决实际问题的能力

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-11-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言:
  • 一、初步了解红黑树
    • 1.1 红黑树的概念
    • 1.2 红黑树规则
    • 1.3 红黑树的路径
      • 1.3.1 思考一下,红黑树如何确保最长路径不超过最短路径的 2 倍的?
    • 1.4 红黑树的效率:
  • 二、红黑树基本逻辑
    • 2.1 基本结构的实现
    • 2.2 插入逻辑以及代码实现
      • 2.2.1 红黑树树插入一个值的大概过程
      • 2.2.2 三种情况分析:
    • 插入代码实现:
    • 查找代码实现:
    • size()接口实现
      • public:
      • private:
      • 双接口版:
    • Height()接口实现
    • InOrder()接口实现
  • 三、红黑树的检查
    • CheckColour()接口实现
  • 四、完整代码
    • RBTree.h:
    • Test.cpp:
    • void testRBTree1()测试结果:
    • void testRBTree2()测试结果:
  • 结尾:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档