2023-02-16 03:39:01 +08:00
|
|
|
|
# 插入排序
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2022-11-23 03:56:25 +08:00
|
|
|
|
「插入排序 Insertion Sort」是一种基于 **数组插入操作** 的排序算法。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-02-04 18:38:52 +08:00
|
|
|
|
「插入操作」原理:选定某个待排序元素为基准数 `base`,将 `base` 与其左侧已排序区间元素依次对比大小,并插入到正确位置。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-02-04 18:38:52 +08:00
|
|
|
|
回忆数组插入操作,我们需要将从目标索引到 `base` 之间的所有元素向右移动一位,然后再将 `base` 赋值给目标索引。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-02-26 18:18:34 +08:00
|
|
|
|
![单次插入操作](insertion_sort.assets/insertion_operation.png)
|
2022-11-23 15:50:59 +08:00
|
|
|
|
|
2023-02-16 03:39:01 +08:00
|
|
|
|
## 算法流程
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-03-25 18:41:22 +08:00
|
|
|
|
循环执行插入操作:
|
|
|
|
|
|
|
|
|
|
1. 先选取数组的 **第 2 个元素** 为 `base` ,执行插入操作后,**数组前 2 个元素已完成排序**。
|
|
|
|
|
2. 选取 **第 3 个元素** 为 `base` ,执行插入操作后,**数组前 3 个元素已完成排序**。
|
|
|
|
|
3. 以此类推……最后一轮选取 **数组尾元素** 为 `base` ,执行插入操作后,**所有元素已完成排序**。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-02-26 18:18:34 +08:00
|
|
|
|
![插入排序流程](insertion_sort.assets/insertion_sort_overview.png)
|
2022-11-23 15:50:59 +08:00
|
|
|
|
|
2022-11-22 17:47:26 +08:00
|
|
|
|
=== "Java"
|
|
|
|
|
|
2022-11-27 04:20:30 +08:00
|
|
|
|
```java title="insertion_sort.java"
|
2023-02-07 04:43:52 +08:00
|
|
|
|
[class]{insertion_sort}-[func]{insertionSort}
|
2022-12-01 18:28:57 +08:00
|
|
|
|
```
|
|
|
|
|
|
2022-11-27 04:20:30 +08:00
|
|
|
|
=== "C++"
|
|
|
|
|
|
|
|
|
|
```cpp title="insertion_sort.cpp"
|
2023-02-08 04:17:26 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-11-27 04:20:30 +08:00
|
|
|
|
```
|
|
|
|
|
|
2022-11-26 01:40:49 +08:00
|
|
|
|
=== "Python"
|
|
|
|
|
|
2022-11-27 04:20:30 +08:00
|
|
|
|
```python title="insertion_sort.py"
|
2023-02-06 23:23:21 +08:00
|
|
|
|
[class]{}-[func]{insertion_sort}
|
2022-11-26 01:40:49 +08:00
|
|
|
|
```
|
|
|
|
|
|
2022-12-03 01:31:29 +08:00
|
|
|
|
=== "Go"
|
|
|
|
|
|
|
|
|
|
```go title="insertion_sort.go"
|
2023-02-09 04:45:06 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
=== "JavaScript"
|
|
|
|
|
|
2023-02-08 04:27:55 +08:00
|
|
|
|
```javascript title="insertion_sort.js"
|
2023-02-08 19:45:06 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
=== "TypeScript"
|
|
|
|
|
|
|
|
|
|
```typescript title="insertion_sort.ts"
|
2023-02-08 19:45:06 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
=== "C"
|
|
|
|
|
|
|
|
|
|
```c title="insertion_sort.c"
|
2023-02-11 18:22:27 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
=== "C#"
|
|
|
|
|
|
|
|
|
|
```csharp title="insertion_sort.cs"
|
2023-02-08 22:18:02 +08:00
|
|
|
|
[class]{insertion_sort}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
2023-01-08 19:41:05 +08:00
|
|
|
|
=== "Swift"
|
|
|
|
|
|
|
|
|
|
```swift title="insertion_sort.swift"
|
2023-02-08 20:30:05 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2023-01-08 19:41:05 +08:00
|
|
|
|
```
|
|
|
|
|
|
2023-02-01 22:03:04 +08:00
|
|
|
|
=== "Zig"
|
|
|
|
|
|
|
|
|
|
```zig title="insertion_sort.zig"
|
2023-02-09 22:57:25 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2023-02-01 22:03:04 +08:00
|
|
|
|
```
|
|
|
|
|
|
2023-02-16 03:39:01 +08:00
|
|
|
|
## 算法特性
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-03-25 18:41:22 +08:00
|
|
|
|
**时间复杂度 $O(n^2)$** :最差情况下,各轮插入操作循环 $n - 1$ , $n-2$ , $\cdots$ , $2$ , $1$ 次,求和为 $\frac{(n - 1) n}{2}$ ,使用 $O(n^2)$ 时间。输入数组完全有序下,达到最佳时间复杂度 $O(n)$ ,因此是“自适应排序”。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-03-25 18:41:22 +08:00
|
|
|
|
**空间复杂度 $O(1)$** :指针 $i$ , $j$ 使用常数大小的额外空间,因此是“原地排序”。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-03-25 18:41:22 +08:00
|
|
|
|
在插入操作中,我们会将元素插入到相等元素的右边,不会改变它们的次序,因此是“稳定排序”。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-02-16 03:39:01 +08:00
|
|
|
|
## 插入排序 vs 冒泡排序
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-03-25 18:41:22 +08:00
|
|
|
|
回顾「冒泡排序」和「插入排序」的复杂度分析,两者的循环轮数都是 $\frac{(n - 1) n}{2}$ 。但不同的是:
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-03-25 18:41:22 +08:00
|
|
|
|
- 冒泡操作基于 **元素交换** 实现,需要借助一个临时变量实现,共 3 个单元操作;
|
|
|
|
|
- 插入操作基于 **元素赋值** 实现,只需 1 个单元操作;
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-03-25 18:41:22 +08:00
|
|
|
|
因此,可以粗略估计出冒泡排序的计算开销约为插入排序的 3 倍,因此更受欢迎。实际上,许多编程语言(例如 Java)的内置排序函数都使用到了插入排序,大致思路为:
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
|
|
|
|
- 对于 **长数组**,采用基于分治的排序算法,例如「快速排序」,时间复杂度为 $O(n \log n)$ ;
|
|
|
|
|
- 对于 **短数组**,直接使用「插入排序」,时间复杂度为 $O(n^2)$ ;
|
|
|
|
|
|
2023-03-25 18:41:22 +08:00
|
|
|
|
**在数据量较小时插入排序更快**,这是因为复杂度中的常数项(即每轮中的单元操作数量)占主导作用。这个现象与「线性查找」和「二分查找」的情况类似。
|