2023-02-16 03:39:01 +08:00
|
|
|
|
# 插入排序
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-05-23 21:20:14 +08:00
|
|
|
|
「插入排序 Insertion Sort」是一种简单的排序算法,它的工作原理与手动整理一副牌的过程非常相似。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-05-23 21:20:14 +08:00
|
|
|
|
具体来说,我们在未排序区间选择一个基准元素,将该元素与其左侧已排序区间的元素逐一比较大小,并将该元素插入到正确的位置。
|
|
|
|
|
|
|
|
|
|
回忆数组的元素插入操作,设基准元素为 `base` ,我们需要将从目标索引到 `base` 之间的所有元素向右移动一位,然后再将 `base` 赋值给目标索引。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-02-26 18:18:34 +08:00
|
|
|
|
![单次插入操作](insertion_sort.assets/insertion_operation.png)
|
2022-11-23 15:50:59 +08:00
|
|
|
|
|
2023-02-16 03:39:01 +08:00
|
|
|
|
## 算法流程
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-04-10 03:11:49 +08:00
|
|
|
|
插入排序的整体流程如下:
|
2023-03-25 18:41:22 +08:00
|
|
|
|
|
2023-05-23 21:20:14 +08:00
|
|
|
|
1. 初始状态下,数组的第 1 个元素已完成排序。
|
|
|
|
|
2. 选取数组的第 2 个元素作为 `base` ,将其插入到正确位置后,**数组的前 2 个元素已排序**。
|
|
|
|
|
3. 选取第 3 个元素作为 `base` ,将其插入到正确位置后,**数组的前 3 个元素已排序**。
|
|
|
|
|
4. 以此类推,在最后一轮中,选取最后一个元素作为 `base` ,将其插入到正确位置后,**所有元素均已排序**。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-02-26 18:18:34 +08:00
|
|
|
|
![插入排序流程](insertion_sort.assets/insertion_sort_overview.png)
|
2022-11-23 15:50:59 +08:00
|
|
|
|
|
2022-11-22 17:47:26 +08:00
|
|
|
|
=== "Java"
|
|
|
|
|
|
2022-11-27 04:20:30 +08:00
|
|
|
|
```java title="insertion_sort.java"
|
2023-02-07 04:43:52 +08:00
|
|
|
|
[class]{insertion_sort}-[func]{insertionSort}
|
2022-12-01 18:28:57 +08:00
|
|
|
|
```
|
|
|
|
|
|
2022-11-27 04:20:30 +08:00
|
|
|
|
=== "C++"
|
|
|
|
|
|
|
|
|
|
```cpp title="insertion_sort.cpp"
|
2023-02-08 04:17:26 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-11-27 04:20:30 +08:00
|
|
|
|
```
|
|
|
|
|
|
2022-11-26 01:40:49 +08:00
|
|
|
|
=== "Python"
|
|
|
|
|
|
2022-11-27 04:20:30 +08:00
|
|
|
|
```python title="insertion_sort.py"
|
2023-02-06 23:23:21 +08:00
|
|
|
|
[class]{}-[func]{insertion_sort}
|
2022-11-26 01:40:49 +08:00
|
|
|
|
```
|
|
|
|
|
|
2022-12-03 01:31:29 +08:00
|
|
|
|
=== "Go"
|
|
|
|
|
|
|
|
|
|
```go title="insertion_sort.go"
|
2023-02-09 04:45:06 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
=== "JavaScript"
|
|
|
|
|
|
2023-02-08 04:27:55 +08:00
|
|
|
|
```javascript title="insertion_sort.js"
|
2023-02-08 19:45:06 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
=== "TypeScript"
|
|
|
|
|
|
|
|
|
|
```typescript title="insertion_sort.ts"
|
2023-02-08 19:45:06 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
=== "C"
|
|
|
|
|
|
|
|
|
|
```c title="insertion_sort.c"
|
2023-02-11 18:22:27 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
=== "C#"
|
|
|
|
|
|
|
|
|
|
```csharp title="insertion_sort.cs"
|
2023-02-08 22:18:02 +08:00
|
|
|
|
[class]{insertion_sort}-[func]{insertionSort}
|
2022-12-03 01:31:29 +08:00
|
|
|
|
```
|
|
|
|
|
|
2023-01-08 19:41:05 +08:00
|
|
|
|
=== "Swift"
|
|
|
|
|
|
|
|
|
|
```swift title="insertion_sort.swift"
|
2023-02-08 20:30:05 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2023-01-08 19:41:05 +08:00
|
|
|
|
```
|
|
|
|
|
|
2023-02-01 22:03:04 +08:00
|
|
|
|
=== "Zig"
|
|
|
|
|
|
|
|
|
|
```zig title="insertion_sort.zig"
|
2023-02-09 22:57:25 +08:00
|
|
|
|
[class]{}-[func]{insertionSort}
|
2023-02-01 22:03:04 +08:00
|
|
|
|
```
|
|
|
|
|
|
2023-06-02 02:40:26 +08:00
|
|
|
|
=== "Dart"
|
|
|
|
|
|
|
|
|
|
```dart title="insertion_sort.dart"
|
|
|
|
|
[class]{}-[func]{insertionSort}
|
|
|
|
|
```
|
|
|
|
|
|
2023-07-26 11:00:53 +08:00
|
|
|
|
=== "Rust"
|
|
|
|
|
|
|
|
|
|
```rust title="insertion_sort.rs"
|
|
|
|
|
[class]{}-[func]{insertion_sort}
|
|
|
|
|
```
|
|
|
|
|
|
2023-02-16 03:39:01 +08:00
|
|
|
|
## 算法特性
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-05-24 00:05:12 +08:00
|
|
|
|
- **时间复杂度 $O(n^2)$ 、自适应排序** :最差情况下,每次插入操作分别需要循环 $n - 1$ , $n-2$ , $\cdots$ , $2$ , $1$ 次,求和得到 $\frac{(n - 1) n}{2}$ ,因此时间复杂度为 $O(n^2)$ 。在遇到有序数据时,插入操作会提前终止。当输入数组完全有序时,插入排序达到最佳时间复杂度 $O(n)$ 。
|
|
|
|
|
- **空间复杂度 $O(1)$ 、原地排序** :指针 $i$ , $j$ 使用常数大小的额外空间。
|
|
|
|
|
- **稳定排序**:在插入操作过程中,我们会将元素插入到相等元素的右侧,不会改变它们的顺序。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-03-26 22:02:37 +08:00
|
|
|
|
## 插入排序优势
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-05-24 00:33:27 +08:00
|
|
|
|
插入排序的时间复杂度为 $O(n^2)$ ,而我们即将学习的快速排序的时间复杂度为 $O(n \log n)$ 。尽管插入排序的时间复杂度相比快速排序更高,**但在数据量较小的情况下,插入排序通常更快**。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-05-24 00:33:27 +08:00
|
|
|
|
这个结论与线性查找和二分查找的适用情况的结论类似。快速排序这类 $O(n \log n)$ 的算法属于基于分治的排序算法,往往包含更多单元计算操作。而在数据量较小时,$n^2$ 和 $n \log n$ 的数值比较接近,复杂度不占主导作用;每轮中的单元计算操作数量起到决定性因素。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-05-24 00:33:27 +08:00
|
|
|
|
实际上,许多编程语言(例如 Java)的内置排序函数都采用了插入排序,大致思路为:对于长数组,采用基于分治的排序算法,例如快速排序;对于短数组,直接使用插入排序。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-05-24 00:33:27 +08:00
|
|
|
|
虽然冒泡排序、选择排序和插入排序的时间复杂度都为 $O(n^2)$ ,但在实际情况中,**插入排序的使用频率显著高于冒泡排序和选择排序**。这是因为:
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-05-23 21:20:14 +08:00
|
|
|
|
- 冒泡排序基于元素交换实现,需要借助一个临时变量,共涉及 3 个单元操作;插入排序基于元素赋值实现,仅需 1 个单元操作。因此,**冒泡排序的计算开销通常比插入排序更高**。
|
|
|
|
|
- 选择排序在任何情况下的时间复杂度都为 $O(n^2)$ 。**如果给定一组部分有序的数据,插入排序通常比选择排序效率更高**。
|
|
|
|
|
- 选择排序不稳定,无法应用于多级排序。
|