常用排序算法

一　冒泡排序

　　通过n次冒泡的过程，让每个元素放到合适的位置。第一次冒泡，让将最大的元素放在最后一个位置；第二次冒泡，让第二大的元素放在倒数第二个位置，以此类推。每一次冒泡的过程是：依次比较相邻的两个元素，如果前一个较大就交换，思路比较清晰，代码如下：

private static void bubbleSort(int[] arr) {
    for (int i = 0; i < arr.length; i++) {   //外层循环控制n次冒泡
        for (int j = 1; j < arr.length - i; j++) {  //内层循环无需到底，因为最末尾的元素已经有序了
            if (arr[j - 1] > arr[j]) {
                int temp = arr[j];
                arr[j] = arr[j - 1];
                arr[j - 1] = temp;
            }
        }
    }
}

　　每一次比较冒泡都是在比较两两相邻元素的关系，事实上，在这个里面还有一个优化空间。比如数组[3,2,4,6]，你第一次冒泡后变成了[2,3,4,6]，这时候已经是有序的了，你进行第二次冒泡，发现没有进行元素交换的操作，那么你就没有必要进行后面的冒泡操作了，因此可以在上面代码里面增加一个标识位，标识本次冒泡操作是否进行了数据交换：如果没有，那么意味着数组已经有序，无需进行后面的冒泡操作；如果有，那么下面的冒泡操作仍需进行，代码如下，也比较简单，这是一种减少了后续比较操作的思路!

private static void bubbleSort2(int[] arr) {

    for (int i = 0; i < arr.length; i++) {   //外层循环控制n次冒泡
        boolean tag = false;
        for (int j = 1; j < arr.length - i; j++) {  //内层循环无需到底，因为最末尾的元素已经有序了
            if (arr[j - 1] > arr[j]) {
                int temp = arr[j];
                arr[j] = arr[j - 1];
                arr[j - 1] = temp;
                tag = true;
            }
        }
        if (!tag) break;
    }
}

　　冒泡排序都是在元数组上进行两两交换，空间复杂度为O(1),因此是原地排序。而且，只有在前一个元素大于后面元素的时候，我们才进行交换操作，而不是大于等于，因此它也是稳定的。对于最好情况下的时间复杂度，可以看到优化前，你是需要n次冒泡的，所以还是O(n^2)，但是优化后，由于可以提前退出外层for循环了，所以最好情况下(原数组已经有序)，你只需要一次冒泡操作，时间复杂度只有O(n)，所以这个标识还是比较有用的。最坏情况下，加不加提前退出标识都一样，时间复杂度都是O(n^2)。

　　平均情况下的时间复杂度，一种思维模式是，看这个数组究竟有多少种排列方式(其实是n!种)，对于每一种排列方式，它的时间复杂度也有所不同，会比较复杂。这里提供一个所有排序算法通用的思路，即逆序对，你所有的排序算法本质上都是在消除逆序对，逆序对越少，原数组越接近有序。即对于数组中任意两个元素，如果i < j且a[i] > a[j]，那么这两个元素构成一个逆序对。后面我们会看到，有些排序算法高效的地方就在于，它一次交换操作可以消除多个逆序对。有序对的定义就是正好相反的。

　　举一个例子，一个数组[4,5,6,3,2,1]，它的有序对有(4,5)、(4,6)、(5,6)，一共3个，一共6个元素，那么排好序以后， 满有序对就是15个，你可以自己算一下。逆序对为15-3 = 12个，你排序的目的就是要消除这12个逆序对。而对于冒泡排序来说，你每一次交换操作，就消除了一个逆序对。也就是交换次数恒等于逆序对的数目。

　　对于包含n个元素的数组，最好情况下，初识时候逆序对已经是0了，那么你就不需要交换操作了，一次冒泡搞定；最坏情况下，初识时完全逆序，逆序对为n*(n-1)/2，那么就需要这么多次交换操作。所以平均情况下可以简单取一个两者的平均，即平均情况下时间复杂度也是O(n^2)。

二　插入排序

　　插入排序就是从数组的第二个元素开始，依次和前半段的元素比较，找到合适的位置，向后移动元素腾出位置，再把待插入的元素填进去，这里有一个核心思维是，你如果要把一组元素后移，那么你肯定是要从最后一个元素开始，一个一个移动，腾出的位置前一个就能填进来，你要从第一个开始就会比较麻烦，涉及到先保存后面一个元素。插入排序的思想其实比较简单，就是找位置，移动，然后填充进去，找位置就是从前半段有序的数组中找到合适的插入位置，可以从前向后找，也可以从后往前找，当你实际写代码的时候就会发现，从后往前找要容易实现得多。但是要写出一个bug-free的插入排序并不那么容易。可以先看下代码：

private static void insertionSort(int[] arr) {
    for (int i = 1; i < arr.length; i++) {
        int value = arr[i];        //这一步的先行保存下待比较的元素，最后需要把它放到合适的位置去  
        int j = i - 1;           //j没有放在for循环里面，是因为最后需要j这个位置，j的位置就是需要插入的位置
        for (; j >= 0; j--) {
            if (value < arr[j]) {
                arr[j + 1] = arr[j]; //移动元素是依次向后移动，之前i的位置数据可能就被抹掉了，所以我们提前
                保存了value
            } else {
                break;  //说明不需要任何移动，比前半段元素中最大的都还要大，直接break
            }
        }
        arr[j + 1] = value;   //最后进行填充
    }
}

　　针对每一个元素，都和前面已经排好序的数组元素一一比较，从后往前比较，如果比最后一个还大，那就不用动了；这一点上是减少了比较次数的，而且从后往前比较，方便从后往前移动元素。同理，这也是一个原地排序，不需要开辟新的内存空间；而且这也是一个稳定的排序，只有在后面元素更小的时候才会移动，否则是不动的；最好情况下，数组已经有序，不需要移动元素，是O(n)的时间复杂度，这次是因为需要从前往后遍历一次元素，比较一次就break了；最坏情况下，要移动每一个元素，时间复杂度为O(n^2)；平均情况下的时间复杂度也是O(n^2)，因为我们总是需要向一个有序数组中插入新的元素。

　　插入排序的数据移动次数也是就等于逆序对的数目，你有多少个逆序对，就需要移动多少次元素。

三　选择排序

　　插入排序相当于是将整个数组分为前半部分的已排序数组和后半部分的未排序数组，每次从后面拿一个元素，插入到前面已经排好序的数组中；而选择排序也是将整个数组分为两半部分，但是每次是在后半部分的数组中选择最小的元素，放入到前半部分数组的末尾。代码如下：

private static void selectionSort(int[] arr) {
    for (int i = 0; i < arr.length; i++) {
        int min = i;         //用min来保存内层循环中找到的最小元素的索引，在外层循环进行这一次交换操作
        for (int j = i + 1; j < arr.length; j++) {
            if (arr[j] < arr[min]) {
                min = j;
            }
        }
        if (min != i) {   //能找到比第一个元素还小的，就进行交换
            int temp = arr[i];
            arr[i] = arr[min];
            arr[min] = temp;
        }
    }
}

　　上面就是选择排序的代码了，其实思路很容易理解；就是永远在后半数组中找最小的元素，然后和它交换，这次交换其实就是在挑选出最小的元素，放在有序数组的末尾，这里的思路是使用min在记录后面数组中最小元素的位置，如果找到了就交换。显然，选择排序也是一个原地排序算法，空间复杂度O(1)；而且最好、最坏、平均情况下的时间复杂度都是O(n^2)，即使原数组已经有序，你还是少不了内层遍历后续元素去进行比较。那么你再推导一下就发现，选择排序并不是一个稳定的排序算法，比如对于数组[5,3,5,7,4]，会经历[3,5,5,7,4]->[3,4,5,7,5]->[3,4,5,5,7]。在第二次选择的时候第一个5已经跑到最后面去了，两个5的先后顺序发生了变化。

　　思考两个问题：1、复杂度都是O(n^2)，插入排序和冒泡排序哪一种更好？ 2、插入排序是否还有优化空间？

　　答案：1、我们前面看到对于一个数组来讲，冒泡排序的交换次数等于数组中的逆序对数目，交换是通过一个临时变量来做的，一共三次赋值操作；插入排序的数据移动次数也等于数组中逆序对的数目，移动是通过arr[j + 1] = arr[j]这一步赋值操作来做的；可以看到插入排序所需要的操作明显更少，因此其效率会更高。2、插入排序每次移动操作都是在消除一个逆序对，事实上，能不能在此基础一次移动操作消除多个逆序对呢？，学习一下 希尔排序。

四　归并排序

　　归并排序的核心思想是分治，分而治之，将大问题分解为子问题进行求解，先将待排序数组从中间分为两部分，依次对前后两部分数组分别排序，再将两个有序数组进行合并，使得数组整体有序。回想一下之前什么问题可以使用递归来解决？一要原问题可以分解为子问题，二是子问题的求解方式和原问题是一样的，三是这个过程存在终止条件，即子问题分解到多细粒度以后就可以停止分解了，直接求解。这个和分治思维是很相似的，简单来说，分治是一种解决问题的处理思想，而递归是一种编程技巧。


private static void mergeSort(int[] arr, int start, int end) {
    if (start >= end) return;
    int middle = (start + end) / 2;
    mergeSort(arr, start, middle);
    mergeSort(arr, middle + 1, end);
    merge(arr, start, middle, end);
}

private static void merge(int[] arr, int start, int middle, int end) {
    int[] temp = new int[end - start + 1];
    int k = 0;
    int i = start, j = middle + 1;
    while (i <= middle && j <= end) {
        if (arr[i] < arr[j]) {
            temp[k++] = arr[i++];
        } else {
            temp[k++] = arr[j++];
        }
    }
    while (i <= middle) {
        temp[k++] = arr[i++];
    }
    while (j <= end) {
        temp[k++] = arr[j++];
    }

    for (int index = 0; index < temp.length; index++) {
        arr[index + start] = temp[index];
    }
}

　　上面是归并排序代码的Java实现，你需要注意的是，在merge函数中，最后拷贝的那一步，将temp数组中的元素复制给原数组中 相应位置上，arr[index + start] = temp[index]，这一步是其核心。归并排序也是一个稳定的排序算法，因为我们在比较前后两半部分数组的元素大小时，前面的小我们就拷贝前面的，否则拷贝后面的，两个相等元素的前后位置并不会发生变化。

　　归并排序的时间复杂度是O(nlog(n))，而且，最好、最坏以及平均情况下的时间复杂度都是O(nlog(n))，这一点，即使是快排也无法做到，快排在最坏情况下的时间复杂度是O(n^2)，但是归并排序并没有快排应用那么广泛，因为归并排序并非一个原地排序算法，它在排序过程中需要额外的存储空间，空间复杂度为O(n)。

五　快速排序

　　快速排序也利用了"分治"的思想，即把大问题分解为小问题来解决，它的思路是这样的：如果我们要排序数组中从下标p到下标r之间的一组数据，我们选择p到r之间的任意一个数据作为pivot(分区点)，然后遍历数组，将值小于pivot的放在左边，大于pivot的放在右边，这样下标p到r之间的数据就被分为了三个部分：左边的是小于pivot的数据，中间是pivot，右边的都是大于pivot的数据。

　　将上面的步骤递归下去，直到区间缩小为1，就最终得到了整个有序的数组。伪代码如下：

    // 快速排序，A是数组，n表示数组的大小
    quick_sort(A, n) {
        quick_sort_c(A, 0, n-1)
    }
    // 快速排序递归函数，p,r为下标
    quick_sort_c(A, p, r) {
        if p >= r then return
        q = partition(A, p, r) // 获取分区点
        quick_sort_c(A, p, q-1)
        quick_sort_c(A, q+1, r)
    }

　　整体流程上和归并排序比较相似，归并排序的核心函数在于merge函数，快排的核心函数在于partition()函数，它的作用就是随机选择一个分区点pivot（往往我们在代码实现的时候选取的数组最后一个元素），对整个数组进行分区，然后返回pivot的下标。

　　１）仿照归并排序，在不考虑内存消耗的情况下，假如我们可以开辟新的内存空间，那么我们在partition()函数中，可以分别创建出两个新的数组，遍历原数组，将小于pivot的元素拷贝到数组A，大于pivot的元素拷贝到数组B，最后再将数组A和数组B的元素拷贝回原数组。

　　２）按照上面的思路，快排就不是一个原地排序了，我们想尽量让快排的空间复杂度是O(1)，因此我们需要在原地完成数组的分区操作。

　　看一下王争提供的这种快速排序算法的代码，不过我个人认为这种不太容易理解：这里的处理有点类似选择排序：通过游标i把A[p…r-1]分成两部分。A[p…i-1]的元素都是小于pivot的，我们暂且叫它“已处理区间”，A[i…r-1]是“未处理区间”。我们每次都从未处理的区间A[i…r-1]中取一个元素A[j]，与pivot对比，如果小于pivot，则将其加入到已处理区间的尾部，也就是A[i]的位置。数组的插入操作还记得吗？在数组某个位置插入元素，需要搬移数据，非常耗时。当时我们也讲了一种处理技巧，就是交换，在O(1)的时间复杂度内完成插入操作。这里我们也借助这个思想，只需要将A[i]与A[j]交换，就可以在O(1)时间复杂度内将A[j]放到下标为i的位置。

    private static void quickSort(int[] arr, int start, int end) {
        if (start >= end) return;
        int pivot = partition(arr, start, end);
        quickSort(arr, start, pivot - 1);
        quickSort(arr, pivot + 1, end);
    }

    private static int partition(int[] arr, int p, int r) {
        int pivot = arr[r];
        int i = p;
        for (int j = p; j <= r - 1; j++) {
            if (arr[j] < pivot) {
                int temp = arr[i];
                arr[i] = arr[j];
                arr[j] = temp;
                i++;
            }
        }
        int temp = arr[i];
        arr[i] = arr[r];
        arr[r] = temp;
        return i;
    }

　　从上面的过程中，可以看出来快排是一个不稳定的排序算法。如果每次分区操作，都能恰好将数组一分为二，两个区间的元素个数接近相等，那么我们的快排时间复杂度也是O(n*log(n))，但是实际上这种情况比较难以实现：如果在极端情况下，一个已经有序的数组，我们每次区间划分都是极不均等的，就会需要进行大约n次划分，才能完成整个过程，这样时间复杂度就会退化到O(n^2)，平均情况下的时间复杂度为O(n * log(n))。

　　对比归并排序，我们发现，归并排序是自底向上的，先处理子问题，再进行合并；快排恰好相反，它的处理过程是由上向下的，先进行分区，然后再处理子分区。

　　现在我们来思考这一个问题：如何求一个无序数组中的第K大的元素？，很显然，你要是用一个排序算法把这个数组排序一下就没有意义了，至少也需要O(n * log(n))的时间复杂度，有了上面的思路，我们就可以用partition分区函数，将整个过程的时间复杂度降为O(n)，简单来说，就是选择数组区间A[0…n-1]的最后一个元素A[n-1]作为pivot，对数组A[0…n-1]原地分区，这样数组就分成了三部分，A[0…p-1]、A[p]、A[p+1…n-1]。如果p+1=K，那A[p]就是要求解的元素；如果K>p+1, 说明第K大元素出现在A[p+1…n-1]区间，我们再按照上面的思路递归地在A[p+1…n-1]这个区间内查找。同理，如果K<p+1，那我们就在A[0…p-1] 区间查找。复用前面的分区函数，代码如下：

    private static int partition(int[] arr, int p, int r) {
        int pivot = arr[r];
        int i = p;
        for (int j = p; j <= r - 1; j++) {
            if (arr[j] < pivot) {
                int temp = arr[i];
                arr[i] = arr[j];
                arr[j] = temp;
                i++;
            }
        }
        int temp = arr[i];
        arr[i] = arr[r];
        arr[r] = temp;
        return i;
    }

    private static int getKthNumber(int[] ar, int start, int end, int k) {
        int result;
        int q = partition(ar, start, end);
        if (q + 1 == k) {
            result = ar[q];
        } else if (q + 1 > k) {
            result = getKthNumber(ar, start, q - 1, k);
        } else {
            result = getKthNumber(ar, q + 1, end, k);
        }
        return result;
    }

六　桶排序

　　桶排序，即这是一个理想情况下接近O(n)时间复杂度的排序算法，核心思想就是将待排序的数据划分到几个有序的桶里面，每个桶里的数据再进行单独排序，桶内数据排好序以后，再按顺序将各个桶的数据取出即可。但是接近O(n)的时间复杂度也是有条件的，首先，数据在各个桶内要分布均匀；其次，只有在桶的个数接近于数据数目时，复杂度才会退化到O(n)。

　　桶排序多用于外部排序的情况，即数据量较大，无法一次将数据全部load到内存中进行排序。

七　计数排序

　　计数排序，本质上是一种特殊的桶排序。比如，当待排序的n个数据，所处范围并不大时，比如最大值为k，那么我们就可以将数据划分为k + 1个桶，每个桶内的数据都是相等的，这样相比于桶排序，还省去了桶内一次排序的时间。这个思想有点像我们使用位图来存储某些数据时，比如我需要存储记录一年中每一天是否是晴天，你可以用一个map，key为日期，value是true或false。；也可以使用一个位图，一共只需要365位，每一位都是0或1，这样可以节省存储。

　　这里举了一个计数排序的例子，比如，现在假设有500w考生的高考成绩，我们需要对其进行排序（忽略事实上500w直接load到内存排的情况）。这里就很适用我们的计数排序了，因为分数的范围并不大，是 0-900，那么我们可以将分数划分到901个桶内，每个桶内存储的都是等于这个当前这个分数的人数，计数排序非常适用这种数据量远大于数据范围的情况，王争在这一章中提供了一种非常容易实现的算法，但是需要较多的图才比较容易理解，这里就不总结了。反正我跟着理解一遍后，实现的代码是很容易写出来的，这里也没太大的必要把代码贴出来。

总结

　　上面大概介绍了几种常用的排序算法，事实上，堆排序也比较常用；我们最常用的其实是快排，前面提到如果分区点pivot选择的不好，快排就会退化为O(n^2)的时间复杂度，所以我们可以通过尽量采用合理的分区点，来避免这种情况，理想的分区点，应该是分成的两个区域数据量差距不大。比较常用的方法有下面两种：

1）三数取中法：前面的快排实现代码中，我们为了简单总是选择最后一个元素作为分区点，如果数组本身就已经接近有序，这样就会划分的不够好，所以我们每次取pivot的时候，从区间的首、尾和中间各自取一个数，选取这三个数的中间值作为pivot，这样肯定会比简单的每次都取最后一个数要好，甚至当待排序数组的规模较大时，我们可以推广到五数取中、十数取中。
2）随机法：随机法就是每次从要排序的区间中，随机选择一个元素作为分区点。这种方法并不能保证每次分区点都选的比较好，但是从概率的角度来看，也不大可能会出现每次分区点都选的很差的情况，所以平均情况下，这样选的分区点是比较好的。时间复杂度退化为最糟糕的O(n2)的情况，出现的可能性不大。

　　事实上，很多标准库里面实现的排序算法，比如C的qsort()，Java的Arrays.sort()，实现的时候都不只使用一种排序算法，往往在数据量较小的时候，优先使用归并排序来完成，因为此时的空间耗费是可以接受的；数据量较大时，才使用快速排序，在快速排序中对小区间再排序时，又可能使用插入排序。你最好花时间分析一下Java的默认sort实现方式，体会一下对性能的压榨。

　　在Java8中的Arrays.sort()方法源码中，当数据量小于47时，采用插入排序；大于47而小于286时，使用双轴快排；大于286的时候使用TimSort，值得研究一番。