hello-algo/docs/chapter_sorting/insertion_sort.md
2023-05-23 21:20:14 +08:00

4.2 KiB
Executable file
Raw Blame History

插入排序

「插入排序 Insertion Sort」是一种简单的排序算法它的工作原理与手动整理一副牌的过程非常相似。

具体来说,我们在未排序区间选择一个基准元素,将该元素与其左侧已排序区间的元素逐一比较大小,并将该元素插入到正确的位置。

回忆数组的元素插入操作,设基准元素为 base ,我们需要将从目标索引到 base 之间的所有元素向右移动一位,然后再将 base 赋值给目标索引。

单次插入操作

算法流程

插入排序的整体流程如下:

  1. 初始状态下,数组的第 1 个元素已完成排序。
  2. 选取数组的第 2 个元素作为 base ,将其插入到正确位置后,数组的前 2 个元素已排序
  3. 选取第 3 个元素作为 base ,将其插入到正确位置后,数组的前 3 个元素已排序
  4. 以此类推,在最后一轮中,选取最后一个元素作为 base ,将其插入到正确位置后,所有元素均已排序

插入排序流程

=== "Java"

```java title="insertion_sort.java"
[class]{insertion_sort}-[func]{insertionSort}
```

=== "C++"

```cpp title="insertion_sort.cpp"
[class]{}-[func]{insertionSort}
```

=== "Python"

```python title="insertion_sort.py"
[class]{}-[func]{insertion_sort}
```

=== "Go"

```go title="insertion_sort.go"
[class]{}-[func]{insertionSort}
```

=== "JavaScript"

```javascript title="insertion_sort.js"
[class]{}-[func]{insertionSort}
```

=== "TypeScript"

```typescript title="insertion_sort.ts"
[class]{}-[func]{insertionSort}
```

=== "C"

```c title="insertion_sort.c"
[class]{}-[func]{insertionSort}
```

=== "C#"

```csharp title="insertion_sort.cs"
[class]{insertion_sort}-[func]{insertionSort}
```

=== "Swift"

```swift title="insertion_sort.swift"
[class]{}-[func]{insertionSort}
```

=== "Zig"

```zig title="insertion_sort.zig"
[class]{}-[func]{insertionSort}
```

算法特性

时间复杂度 $O(n^2)$ :最差情况下,每次插入操作分别需要循环 n - 1 , n-2 , \cdots , 2 , 1 次,求和得到 \frac{(n - 1) n}{2} ,因此时间复杂度为 O(n^2) 。当输入数组完全有序时,插入排序达到最佳时间复杂度 O(n) ,因此是“自适应排序”。

空间复杂度 $O(1)$ :指针 i , j 使用常数大小的额外空间,所以插入排序是“原地排序”。

在插入操作过程中,我们会将元素插入到相等元素的右侧,不会改变它们的顺序,因此是“稳定排序”。

插入排序优势

插入排序的时间复杂度为 O(n^2) ,而我们即将学习的快速排序的时间复杂度为 O(n \log n) 。尽管插入排序的时间复杂度相比快速排序更高,但在数据量较小的情况下,插入排序通常更快。这是因为快速排序属于基于分治的排序算法,包含更多单元计算操作。而在数据量较小时,复杂度中的常数项起主导作用。这个现象与线性查找和二分查找的适用情况相似。

实际上,许多编程语言(例如 Java的内置排序函数都采用了插入排序大致思路为

  • 对于长数组,采用基于分治的排序算法,例如快速排序,时间复杂度为 O(n \log n)
  • 对于短数组,直接使用插入排序,时间复杂度为 O(n^2)

虽然冒泡排序、选择排序和插入排序的时间复杂度都为 O(n^2) ,但在实际情况中,插入排序出现的频率远远高于冒泡排序和选择排序。这是因为:

  • 冒泡排序基于元素交换实现,需要借助一个临时变量,共涉及 3 个单元操作;插入排序基于元素赋值实现,仅需 1 个单元操作。因此,冒泡排序的计算开销通常比插入排序更高
  • 选择排序在任何情况下的时间复杂度都为 O(n^2)如果给定一组部分有序的数据,插入排序通常比选择排序效率更高
  • 选择排序不稳定,无法应用于多级排序。