在一些应用问题中,需要将 n
个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为 并查集 (union-findset
)。
比如:某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
,给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。(负号下文解释)
毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,于是:
西安学生小分队 s1={0,6,7,8}
,成都学生小分队 s2={1,4,9}
,武汉学生小分队 s3={2,3,5}
就相互认识了,10
个人形成了三个小团体。假设右三个群主 0,1,2
担任队长,负责大家的出行。
一趟火车之旅后,每个小分队成员就互相熟悉,称为了一个朋友圈。
从上图可以看出:编号 6,7,8
同学属于 0
号小分队,该小分队中有 4
人(包含队长0
);编号为 4
和 9
的同学属于 1
号小分队,该小分队有 3
人(包含队长1
),编号为 3
和 5
的同学属于 2
号小分队,该小分队有 3
个人(包含队长1
)。
仔细观察数组中内融化,可以得出以下结论:
在公司工作一段时间后,西安小分队中 8
号同学与成都小分队 1
号同学奇迹般的走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子:
现在 0
集合有 7
个人,2
集合有 3
个人,总共两个朋友圈。
通过以上例子可知,并查集一般可以解决一下问题:
其中在合并的时候做了一些小优化:
FindRoot
的过程中,我们直接 将路径上的节点的双亲变成根节点 即可~#pragma once
#include <vector>
#include <iostream>
using namespace std;
class UnionFindSet
{
private:
vector<int> _ufs; // 存放节点双亲下标(负数代表根节点)
public:
UnionFindSet(size_t n)
:_ufs(n, -1)
{}
// 将两个集合并起来
void Union(int x1, int x2)
{
// 先找到两个集合的根
int root1 = FindRoot(x1);
int root2 = FindRoot(x2);
// 如果本身就是一个集合,那就不用合并
if (root1 == root2)
return;
// 做一下优化,让小的往大的集合合并
if (abs(_ufs[root1]) < abs(_ufs[root2]))
swap(root1, root2);
// 将新的根的值也就是这个集合总个数更新
_ufs[root1] += _ufs[root2];
// 将他们链接起来,这里统一把第二个合并到第一个
_ufs[root2] = root1;
}
// 找一个节点的根的值也就是
int FindRoot(int x)
{
int root = x;
while (_ufs[root] >= 0)
{
root = _ufs[root];
}
// 进行路径压缩优化
while (_ufs[x] >= 0)
{
// 注意要先用tmp将x的双亲保存下来,再让x的双亲变成根节点
int tmp = _ufs[x];
_ufs[x] = root;
// x不断更新为路径上的双亲,直到遇到根节点
x = tmp;
}
return root;
}
// 检测是否在同一个集合
bool IsInSameSet(int x1, int x2)
{
return FindRoot(x1) == FindRoot(x2);
}
// 求一共有几个集合
size_t SetSize(int x)
{
size_t n = 0;
for (size_t i = 0; i < _ufs.size(); ++i)
{
if (_ufs[i] < 0)
n++;
}
return n;
}
};
思路:
这道题其实如果我们把上面的并查集实现直接贴上去的话,解决起来就非常方便,因为这道题要求省份的数量,其实就是求并查集的个数嘛,所以直接有并查集的实现的话,直接遍历这个矩阵将值为1的下标加入同一个集合,其他的话就单独为一个集合,这样子就能求出一共有多少省份了~ 但是一般我们要去实现并查集的话,稍微会浪费点时间,其实有了并查集的思想,我们可以直接使用这个思想来完成而没必要去搭建一个完整的并查集!
还是一样,我们用 vector
来存放我们的下标(负数的话代表是根,绝对值代表集合的个数),然后我们这里需要一个 findroot
函数,用来找根的下标,这里利用 lambda
表达式,比较方便一点。
接着就是合并的过程,遍历这个矩阵 isConnected
,然后遇到 isConnected[i][j]
为 1
的说明是相通的,则将其放到我们的 vector
中去,注意还要判断一下这个小集合已经存在大集合了,是的话就没必要重新加入 vector
中了。
最后求出 vector
中集合的总个数然后返回即可~
class Solution {
public:
int findCircleNum(vector<vector<int>>& isConnected) {
vector<int> ufs(isConnected.size(), -1);
// 寻找x的根
auto findroot = [&ufs](int x)
{
while(ufs[x] >= 0)
x = ufs[x];
return x;
};
// 联合起来
for(size_t i = 0; i < isConnected.size(); ++i)
{
for(size_t j = 0; j < isConnected[i].size(); ++j)
{
// 若为1则当前的i和j是连通的
if(isConnected[i][j] == 1)
{
int root1 = findroot(i);
int root2 = findroot(j);
if(root1 != root2)
{
ufs[root1] += ufs[root2];
ufs[root2] = root1;
}
}
}
}
// 计算总的集合个数
int n = 0;
for(size_t i = 0; i < ufs.size(); ++i)
{
if(ufs[i] < 0)
n++;
}
return n;
}
};
思路:
思路都是大同小异的,我们无需去实现并查集,只要有并查集的思想即可~
思路就是先遍历第一遍 equations
,将 equations
中的满足等式的字母在 vector
中合并为一个集合;接着遍历第二遍 equations
,将其中不满足 equations
中的等式的字母,判断一下其是否在 vector
中为一个集合,是的话就冲突了,直接返回 false
。当所有遍历完毕后没错的话,则返回 true
~
class Solution {
public:
bool equationsPossible(vector<string>& equations) {
vector<int> ufs(26, -1);
auto findroot = [&ufs](int x)
{
while(ufs[x] >= 0)
x = ufs[x];
return x;
};
// 遍历第一遍将equations满足的放到vector中
for(size_t i = 0; i < equations.size(); ++i)
{
if(equations[i][1] == '=')
{
int root1 = findroot(equations[i][0] - 'a');
int root2 = findroot(equations[i][3] - 'a');
// 合并
if(root1 != root2)
{
ufs[root1] += ufs[root2];
ufs[root2] = root1;
}
}
}
// 遍历第二遍的时候判断equations不满足的时候在集合中,在的话就错了
for(size_t i = 0; i < equations.size(); ++i)
{
if(equations[i][1] == '!')
{
int root1 = findroot(equations[i][0] - 'a');
int root2 = findroot(equations[i][3] - 'a');
// 根相同说明在同一个集合,说明错误了
if(root1 == root2)
return false;
}
}
return true;
}
};
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有