버블 정렬로 해보는 점진적 개선: 버블 정렬에서 칵테일 정렬까지

버블 정렬은 가장 간단한 정렬 알고리즘으로 꼽을 수 있다. 구현이 매우 간단하여 급하게 정렬 알고리즘이 필요할 때 요긴하게 쓰인다. 하지만, 시간 복잡도에서 최악의 경우 O(n^2)이 나오기 때문에 대용량 데이터에서 빠른 성능을 기대하기는 어렵다. 그럼에도 불구하고, 버블 정렬도 몇가지를 개선하면 나름의 성능을 끌어올릴 수가 있다.

이것을 주제로 발표를 한적도 있었는데, 이 때 무슨 자신감이였는지 화이트보드 코딩에 도전했었다. 중간에 머리가 새까매져 단체 일시정지가 있었지만, 어찌저찌 잘 마무리하여 겸손이 주입될 수 있었던 좋은 경험이였다. 재밌는 내용이라고 생각해서 이번에는 글로써 정리해보고자 한다.

정렬

정렬의 핵심 연산에는 교환, 선택, 삽입이 있다. 대부분의 정렬 알고리즘은 이 세 가지를 응용해서 만들어졌다. 교환은 두 원소의 위치를 서로 변경하는 것, 선택은 특정 기준의 원소 하나를 골라내는 것, 삽입은 특정 위치에 원소를 집어넣고 나머지를 밀어내는 것을 말한다. 정렬 알고리즘에는 버블 정렬, 셸 정렬, 퀵 정렬, 병합 정렬 등 많은 알고리즘이 존재하며 각 정렬 알고리즘마다 주로 사용하는 연산이 있다. 그 중 버블 정렬에서는 교환 연산이 주로 쓰인다.

정렬은 왜 하는가?
정렬은 효율적인 조회를 위해 필요한 동작이다. 정렬을 통해 최소, 최대값을 찾거나 특정 값을 빠르게 조회할 수 있다. 특히나, 이분 탐색에서는 특정 값을 조회하기 위해서 정렬된 것이 전제 조건이다.

단순한 정렬 알고리즘에는 버블, 삽입, 선택 정렬이 있는데, 이들은 시간 복잡도는 같으나 삽입과 교환 연산에서 차이가 있다. 인접한 두 요소만 가지고 비교하여 교환하면 버블, 가장 작은 요소를 찾아서 앞에서부터 교환하면 선택, 요소를 적절한 위치에 끼워넣으면 삽입 정렬이다.

이번에 다룰 정렬은 이 중 교환 연산을 주로하는 버블 정렬이다. 이제 버블 정렬에 대해서 자세히 알아보자.

버블 정렬

기본 동작

버블 정렬의 기본 동작(오름차순 기준)은 다음과 같다.

리스트의 처음부터 끝까지 이동하면서 인접한 두 요소를 비교한다.
만약 앞의 요소가 뒤의 요소보다 크다면, 두 요소를 교환한다.
이 과정을 리스트의 끝까지 반복하면 가장 큰 요소가 리스트의 끝으로 이동하게 된다.
이제 리스트의 끝에 있는 가장 큰 요소를 제외하고, 나머지 요소들에 대해 같은 과정을 반복한다.
이 과정을 리스트의 모든 요소가 정렬될 때(n-1번)까지 반복한다.

조금 더 이해하기 쉽게 그림으로 보면, 버블정렬 애니메이션 https://visualgo.net/en/sorting

이를 코드로 구현하면 아래와 같다.

  
def bubble_sort(unsorted_list):
    n = len(unsorted_list)
    for i in range(n - 1): # n - 1번 정렬
        for j in range(n-1 - i): # 이미 정렬된 요소를 제외하고 나머지 요소들만 비교
            if unsorted_list[j] > unsorted_list[j + 1]:
                unsorted_list[j], unsorted_list[j + 1] = unsorted_list[j + 1], unsorted_list[j]

이어서 정상 동작을 확인하는 테스트 코드를 만들어서 검증해보자. main문에 그대로 테스트 해볼 수도 있지만, 추후 개선 작업에서도 쓰고 본 코드와 분리하기 위해 새로 테스트 코드를 작성하자.

  
import unittest
import time
from bubble_sort import bubble_sort

class TestBubbleSort(unittest.TestCase):
    def test_bubble_sort(self):
        test_data = [29, 10, 14, 37, 15, 20, 38]
        start_time = time.time(); bubble_sort(test_data); end_time = time.time()
        execution_time = (end_time - start_time) * 1000  # ms로 변환
        self.assertEqual(test_data, [10, 14, 15, 20, 29, 37, 38])
        print(f"실행 시간: {execution_time:.3f} ms")

이를 실행시켜보면 아래와 같은 결과가 나오면서 제대로 동작하는 것을 확인할 수 있다.

  
test_bubble_sort (__main__.TestBubbleSort.test_bubble_sort) ... 실행 시간: 0.005 ms
ok

----------------------------------------------------------------------
Ran 1 test in 0.000s

OK

성능 측정

개선에 앞서 현재 성능을 측정해볼 필요가 있다. 주로 사용하고 있는 연산이 비교와 교환이므로 이들의 횟수를 측정해보면 될 것이다.

  
def bubble_sort(unsorted_list):
    n = len(unsorted_list)
    compare_count = 0
    exchange_count = 0
    for i in range(n - 1): # n - 1번 정렬
        for j in range(n-1 - i): # 이미 정렬된 요소를 제외하고 나머지 요소들만 비교
            compare_count += 1
            if unsorted_list[j] > unsorted_list[j + 1]:
                unsorted_list[j], unsorted_list[j + 1] = unsorted_list[j + 1], unsorted_list[j]
                exchange_count += 1
    print(f"\n비교 횟수 : {compare_count}회 | 교환 횟수 : {exchange_count}")

[29, 10, 14, 37, 15, 20, 38] 데이터 기준으로 첫번째 정렬에서 6번 비교, 두번째 정렬에서 5번, 세번째 정렬에서 4번, … (6+5+4+3+2+1)해서 총 21번의 비교가 일어날 것이다. 교환 횟수는 교환해보면서 구해보자.

[*29*, 10, 14, *37*, 15, 20, 38] => [10, 14, *29*, 15, 20, *37*, 38] : 4번 (29 2번, 37 2번)
[10, 14, *29*, 15, 20, 37, 38] => [10, 14, 15, 20, *29*, 37, 38] : 2번 (29 2번)

총 6번의 교환이 일어날 것을 예상할 수 있다.

  
test_bubble_sort (__main__.TestBubbleSort.test_bubble_sort) ... 
비교 횟수 : 21회 | 교환 횟수 : 6
실행 시간: 0.012 ms
ok

----------------------------------------------------------------------
Ran 1 test in 0.000s

OK

실제 테스트 코드 실행시에도 예상 횟수와 같다.

1차 개선: 정렬 멈추기

눈치 빠른 사람은 교환 횟수를 구하는 과정에서 벌써 느낌이 왔을 수도 있다. 만약 데이터가 [10, 14, 15, 29, 20, 37, 38] 이러한 형태를 띄면, 하나의 원소만 교환해줘도 정렬이 끝나게 된다. 하지만 현재 로직은 정렬이 끝나도 계속 비교를 이어나가게 되는데 이러면 데이터가 클수록 훨씬 비효율적이게 되는 문제가 발생한다.

정렬이 되지 않은 경우에는 반드시 한번 이상의 교환이 일어난다. 반대로, 만약 정렬이 이미 끝난 상태라면 더이상의 교환이 일어나지 않을 것이다. 그렇다면, 교환 발생 여부를 확인하여 추가적인 정렬을 멈출 수 있다.

  
...
def bubble_sort_check_exchange(unsorted_list):
    n = len(unsorted_list)
    compare_count = 0
    exchange_count = 0
    for i in range(n - 1): # n - 1번 정렬
        exchanged = False
        for j in range(n-1 - i): # 이미 정렬된 요소를 제외하고 나머지 요소들만 비교
            compare_count += 1
            if unsorted_list[j] > unsorted_list[j + 1]:
                unsorted_list[j], unsorted_list[j + 1] = unsorted_list[j + 1], unsorted_list[j]
                exchange_count += 1
                exchanged = True
        if not exchanged: # 이미 정렬이 된 상태라면 정렬을 멈춘다.
            break
    print(f"\n비교 횟수 : {compare_count}회 | 교환 횟수 : {exchange_count}")

이미 정렬됐을 때 멈춰준 결과는 다음과 같다.

비교 횟수 : 11회 | 교환 횟수 : 1
실행 시간: 0.005 ms

비교 횟수가 10회나 줄어든 것을 확인할 수 있다. 하지만 실행 시간은 똑같게 나오는데 이는 데이터의 크기가 작기 때문이다. 따라서 데이터의 크기를 10,000개로 늘려서 테스트 해봤다. 10,000개의 정렬된 정수에서 하나만 정렬이 되지 않는 경우를 가정했다.

  
...

class TestBubbleSort(unittest.TestCase):
    large_data = list(range(1, 10001))
    large_data[-1], large_data[-2] = large_data[-2], large_data[-1] # 한번 교환
    ...

    def test_bubble_sort_many(self):
        test_data = self.large_data.copy()
        start_time = time.time(); bubble_sort(test_data); end_time = time.time()
        execution_time = (end_time - start_time) * 1000  # ms로 변환
        self.assertEqual(test_data, list(range(1, 10001)))
        print(f"실행 시간: {execution_time:.3f} ms")
  
    def test_bubble_sort_check_exchange_many(self):
        test_data = self.large_data.copy()
        start_time = time.time(); bubble_sort_check_exchange(test_data); end_time = time.time()
        execution_time = (end_time - start_time) * 1000  # ms로 변환
        self.assertEqual(test_data, list(range(1, 10001)))
        print(f"실행 시간: {execution_time:.3f} ms")

개선된 버블 정렬에 경우에 첫번째 정렬에서 모든 수가 정렬되면서 두번째 정렬 때 교환이 일어나지 않아 루프가 종료되게 된다. 이로써 일찍이 정렬이 끝날 경우 훨씬 좋은 성능을 나타나는 것을 확인했다.

  
test_bubble_sort_check_exchange_many (__main__.TestBubbleSort.test_bubble_sort_check_exchange_many) ... 
비교 횟수 : 19997회 | 교환 횟수 : 1
실행 시간: 1.053 ms
ok
test_bubble_sort_many (__main__.TestBubbleSort.test_bubble_sort_many) ... 
비교 횟수 : 49995000회 | 교환 횟수 : 1
실행 시간: 1999.569 ms
ok

데이터가 무작위로 섞인 경우에는 오히려 개선된 버블 정렬이 조금 더 느린 성능이 나왔다. 이는 교환 발생 여부를 확인하는 로직으로 인해 추가적인 작업을 하기 때문이였다.

  
test_bubble_sort_check_exchange_many (__main__.TestBubbleSort.test_bubble_sort_check_exchange_many) ... 
비교 횟수 : 49984847회 | 교환 횟수 : 25024270
실행 시간: 3335.016 ms
ok
test_bubble_sort_many (__main__.TestBubbleSort.test_bubble_sort_many) ... 
비교 횟수 : 49995000회 | 교환 횟수 : 25024270
실행 시간: 3271.251 ms
ok

2차 개선: 범위 줄이기

이번에는 다른 상황을 가정해보자. [10, 14, 15, 29, 20, 37, 38] 같은 데이터가 있다. 이 데이터는 거의 정렬되어 있어 보이는 데이터이다. 이러한 경우에 29가 뒤에서 세번째로 가기 위해 6번의 비교와 1번의 교환이 일어날 것이다. 그 다음에 5번의 비교가 일어나면서 교환이 일어나지 않아 루프가 종료될 것이다. 여기서 문제점은 이미 정렬이 끝났는데 모든 요소를 끝까지 순회해서 교환 여부를 확인해야한다는 것이다.

우리는 사실 교환이 마지막에 일어난 순간부터 그 뒤는 모두 정렬됨을 알 수 있다. 만약 교환이 일어났다는 것은 정렬되어 있지 않았다는 것을 의미하기 때문이다. 다시 말해, 앞에서부터 정렬되어 있지 않으면 비교 후 교환이 일어나고 정렬 되어 있다면 비교만 하고 넘어간다. 그러면 마지막 교환한 시점부터 끝까지는 정렬되어 있음을 보장한다는 것을 알 수 있다. 따라서 우리는 이렇게 정렬되어 있는 범위는 비교할 필요가 없기 때문에 스캔 범위를 줄여줄 수 있게 된다.

  
def bubble_sort_except_sorted(unsorted_list):
    n = len(unsorted_list)
    compare_count, exchange_count = 0, 0
    exchanged_idx = n - 1
    for _ in range(n - 1): # n - 1번 정렬
        last_exchanged = 0
        for j in range(exchanged_idx): # 이미 정렬된 요소를 제외하고 나머지 요소들만 비교
            compare_count += 1
            if unsorted_list[j] > unsorted_list[j + 1]:
                unsorted_list[j], unsorted_list[j + 1] = unsorted_list[j + 1], unsorted_list[j]
                exchange_count += 1
                last_exchanged = j
        if not last_exchanged:
            break
        exchanged_idx = last_exchanged
    print(f"\n비교 횟수 : {compare_count}회 | 교환 횟수 : {exchange_count}")

이제는 정렬되어 있는 요소들은 스캔 범위에서 제외했으며 마지막 교환 위치을 통해 루프를 종료 시킬 수도 있다. 그러면 진짜 비교 횟수가 줄었을 지 확인해보자. 테스트 코드는 위에서 진행한 코드와 동일하며 테스트 함수만 새로 만들어줬다.

test_bubble_sort_one_element_by_except_sorted (__main__.TestBubbleSort.test_bubble_sort_one_element_by_except_sorted) ... 
비교 횟수 : 9회 | 교환 횟수 : 1
실행 시간: 0.004 ms
ok

비교 횟수가 2회 줄어든 것을 볼 수 있다. 이것을 만 개의 데이터에도 적용시켜 확연한 차이를 느껴보자. 비교 횟수 차이를 효과적으로 보기 위해 데이터 위치 변경을 아래와 같이 조금 더 앞으로 변경하여 진행했다.

  
class TestBubbleSort(unittest.TestCase):
    large_data = list(range(1, 10001))
    large_data[-1001], large_data[-1002] = large_data[-1002], large_data[-1001]
    ...

의도한 대로 1000번의 비교가 줄어들었다. 그렇다면 더 앞에서 정렬이 끝날 경우 그만큼 비교 횟수를 줄일 수 있다는 것을 알 수 있다.

  
test_bubble_sort_check_except_sorted_many (__main__.TestBubbleSort.test_bubble_sort_check_except_sorted_many) ... 
비교 횟수 : 18997회 | 교환 횟수 : 1
실행 시간: 0.797 ms
ok
test_bubble_sort_check_exchange_many (__main__.TestBubbleSort.test_bubble_sort_check_exchange_many) ... 
비교 횟수 : 19997회 | 교환 횟수 : 1
실행 시간: 0.830 ms
ok

3차 개선: 셰이킹

이번에는 앞에 내용을 조금 더 응용해서 개선시켜볼 수 있다. 앞에선 뒷부분에 스캔 범위만을 줄였는데, 그것과 동일하게 앞부분에도 똑같이 적용시킬 수가 있다. 따라서 양 쪽으로의 스캔 범위를 제한해주는 것이다. 그림을 보면 쉽게 이해가 될 것이다.

아래와 같은 데이터가 있다고 치자. left, right는 양쪽 스캔 범위 끝을 last는 마지막 교환 위치를 가리킨다. 칵테일1

앞에서부터 비교하면서 교환해나간 뒤 마지막 교환 위치를 표시한다. 칵테일2

29가 뒤에서 3번째 위치로 교환됐음을 알 수 있다. 이 때 마지막 교환 위치가 오른쪽으로 스캔하는 범위의 끝이 되면서 스캔 범위를 줄일 수 있다. 이까지는 2차 개선 내용과 동일하다. 칵테일3

여기서부터 달라지는데, 이 시점부터는 오른쪽 스캔 범위 끝을 시작으로 스캔 방향을 반대로 진행한다. 칵테일4

10이 첫번쨰 위치로 교환되면서 마지막 교환이 일어났다. 칵테일5

앞서 마지막 교환한 위치를 통해 왼쪽으로 스캔하는 범위의 끝을 지정했다. 이것을 통해 다음 스캔에서는 그 앞부분을 제외하고 스캔할 수 있게 된다. 다음 스캔에서는 처음 동작부터 다시 진행하며 오른쪽 범위 끝이 왼쪽보다 작아질 때까지 반복한다. 칵테일6

이것을 코드로 옮겨보면 다음과 같다. 앞에서 개선해오던 코드와 구조가 달라보일 수 있으나 맥락은 동일하다.

  
def bubble_sort_bidirectional(unsorted_list):
    n = len(unsorted_list)
    compare_count, exchange_count = 0, 0
    left, right, last = 0, n - 1, 0
    while left < right:
        for i in range(left, right): # 오른쪽 스캔
            compare_count += 1
            if unsorted_list[i] > unsorted_list[i + 1]:
                unsorted_list[i], unsorted_list[i + 1] = unsorted_list[i + 1], unsorted_list[i]
                exchange_count += 1
                last = i
        right = last
                
        for i in range(right, left, -1): # 왼쪽으로 스캔
            compare_count += 1
            if unsorted_list[i - 1] > unsorted_list[i]:
                unsorted_list[i - 1], unsorted_list[i] = unsorted_list[i], unsorted_list[i - 1]
                exchange_count += 1
                last = i
        left = last
    print(f"\n비교 횟수 : {compare_count}회 | 교환 횟수 : {exchange_count}")

이렇게 정렬을 하는 형태가 마치 칵테일 셰이커를 흔드는 것과 비슷하다고 해서 칵테일 셰이커 정렬 또는 셰이커 정렬, 칵테일 정렬이라고 부른다. 사실 양방향으로 버블 정렬을 이어나가는 것이기 때문에 양방향 버블 정렬이라고도 부른다.

이번엔 바로 만 개의 데이터가 무작위로 있을 때를 테스트를 하여 성능을 비교해보자.

  
test_bubble_sort_bidirectional_many (__main__.TestBubbleSort.test_bubble_sort_bidirectional_many) ... 
비교 횟수 : 33458014회 | 교환 횟수 : 25172316
실행 시간: 2743.818 ms
ok
test_bubble_sort_check_except_sorted_many (__main__.TestBubbleSort.test_bubble_sort_check_except_sorted_many) ... 
비교 횟수 : 49942297회 | 교환 횟수 : 25172316
실행 시간: 3518.793 ms
ok
test_bubble_sort_check_exchange_many (__main__.TestBubbleSort.test_bubble_sort_check_exchange_many) ... 
비교 횟수 : 49952514회 | 교환 횟수 : 25172316
실행 시간: 3443.275 ms
ok
test_bubble_sort_many (__main__.TestBubbleSort.test_bubble_sort_many) ... 
비교 횟수 : 49995000회 | 교환 횟수 : 25172316
실행 시간: 3380.295 ms
ok

처음 버블 정렬과 비교했을 때 비교 횟수는 약 33%, 실행 시간은 약 20%정도 감소되었다. 이제껏 개선 중 가장 큰 개선을 이룬 듯하다. 칵테일 정렬로 개선하면서 계속 Stride-1로 접근하기에 공간 지역성이 좋아져 기대를 많이 했으나 기대엔 못 미치는 것 같다.

마무리

실제로 서비스가 동작하는 코드 같은 경우에는 개선시키기 힘들 수가 있다. 다른 부분과 연관되어 있을 가능성이 높아 어떤 영향을 끼칠지 모르며 개선이 개선이 아닐 수 있기 때문이다. 하지만 이렇게 별도로 구현한 코드 같은 경우에는 부담없이 개선시킬 수 있다. 버블 정렬을 조금씩 개선하면서 프로그래밍의 참맛을 느낄 수 있었는데, PL(프로그래밍 언어)단에서의 개선이 가장 확인하기 쉽고 개선시키기 수월하여 재밌는 것 같다.

마지막으로 파이썬에서 제공하는 정렬 함수와 비교해봤다. 역시 O(nlogn)은 다르다. PL에서 지원해주는 정렬 함수를 잘 사용하자.

10,000개 데이터 기준	bubble	1차 개선	2차 개선	3차 개선	Timsort(파이썬 정렬 함수)
비교 횟수	49995000	49991084	49959372	33369175	-
실행 시간(ms)	3310.384	3343.707	3420.667	2656.134	0.825

버블 정렬로 해보는 점진적 개선: 버블 정렬에서 칵테일 정렬까지

정렬

버블 정렬

기본 동작

성능 측정

1차 개선: 정렬 멈추기

2차 개선: 범위 줄이기

3차 개선: 셰이킹

마무리

Further Reading

BOJ 1800: 인터넷 설치의 최소 비용 문제 - 다익스트라와 매개변수 탐색으로 해결하기

자료구조의 기본: 배열부터 해시 테이블까지

C(repas)로 그린 빨강-검정나무