집합

집합과 상호배타적 집합의 개념

집합은 순서와 중복이 없는 원소들을 갖는 자료구조를 말합니다.

특성에 따라 부르는 말이 다양합니다. 해당 챕터에서는 상호 배타적 집합에 집중합니다.

교집합이 없는 집합 관계를 말합니다.

const A = [1, 2, 3];
const B = [4, 5, 6, 7];

집합 A와 B의 원소는 겹치는 경우가 없습니다. 이를 우리는 상호 베타적 집합이라고 할 수 있습니다.

const A = [1, 2, 3];
const B = [3, 4, 5, 6];

위와 같이 중복된 3을 갖고 있을 경우 상호 배타적 집합이 아니라고 합니다.

이는 그래프 알고리즘에서 많이 사용하기 때문에 알고 있어야 합니다. 또한 이런 개념을 활용하는 알고리즘도 다양합니다.

보통 집합은 트리로 표현하며 대표적인 연산은 합치기와 탐색이 있습니다.

각 집합에는 대표 원소가 있어야 합니다.

대표 원소는 집합의 원소 중 집합을 대표하는 역할을 합니다. 집합의 형태를 트리로 표현하므로 루트 노드라고 합니다.

집합을 배열로 표현한다는 것은 하나의 배열로 상호 베타적 관계를 가지는 집합을 모두 표현한다는 것을 의미합니다.

배열의 인덱스는 자신을 배열 값은 부모 노드를 의미합니다.

예를 들어 Array[3] = 9면 노드 3의 부몬 노드는 9임을 나타냅니다. 루트노드는 말 그대로 집합의 대표 이미르 보모가 없고 부모 노드가 자기 자신이 되는 것입니다.

const array = [null, null, 2, 7, null, 2, null, 2, null, 3];

위 배열을 보았을 때 2를 가리키는 5와 7은 2의 자식이고 2는 스스로를 가리키니 해당 인덱스는 루트 노드를 가리키는 것을 볼 수 있습니다.

집합 알고리즘에 주로 쓰이는 연산은 합치기와 탐색입니다. 이 둘을 묶어 유니온-파인드 알고리즘이라고 합니다.

특정 노드의 루트 노드가 무엇인지 탐색하는 방법입니다. 보통 파인드 연산은 특정 노드가 같은 집합에 있는지 확인할 때 사용합니다.

해당 연산의 경우 시간 복잡도는 을 유지합니다. 이를 개선하기 위해 경로 압축을 활용할 수 있습니다.

이를 위해서 우리는 집합 형태를 유지하면서 트리 높이를 줄이는 방향으로 가면 됩니다. 트리의 높이를 줄이므로 앞서 언급한 부모 노드를 거치는 과정을 줄일 수 있습니다.

유니온 연산은 두 집합을 하나로 합치는 연산입니다. '두 집합을 합친다'는 것은 두 집합의 루트 노드를 같게 하는 것입니다.

트리의 깊이가 깊어지면 깊어질수록 연산 비용이 커진다는 단점이 있습니다. 때문에 랭크를 도입합니다.

랭크란?

현재 노드를 기준으로 하였을 때 가장 깊은 노드까지의 경로 길이를 말합니다.

랭크 기반으로 합치기 연산하기

Last modified: 07 August 2024