hello-algo/chapter_sorting/insertion_sort.md

221 lines
8.2 KiB
Markdown
Raw Normal View History

2023-02-08 15:20:18 +08:00
---
comments: true
---
2023-02-24 18:45:27 +08:00
# 11.3.   插入排序
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
「插入排序 Insertion Sort」是一种基于数组插入操作的排序算法。具体来说选择一个待排序的元素作为基准值 `base` ,将 `base` 与其左侧已排序区间的元素逐一比较大小,并将其插入到正确的位置。
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
回顾数组插入操作,我们需要将从目标索引到 `base` 之间的所有元素向右移动一位,然后再将 `base` 赋值给目标索引。
2023-02-08 15:20:18 +08:00
2023-02-26 18:17:57 +08:00
![单次插入操作](insertion_sort.assets/insertion_operation.png)
2023-02-08 15:20:18 +08:00
2023-02-26 19:53:26 +08:00
<p align="center"> Fig. 单次插入操作 </p>
2023-02-24 18:45:27 +08:00
## 11.3.1. &nbsp; 算法流程
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
插入排序的整体流程如下:
2023-03-25 18:41:53 +08:00
2023-04-10 03:12:02 +08:00
1. 首先,选取数组的第 2 个元素作为 `base` ,执行插入操作后,**数组的前 2 个元素已排序**。
2. 接着,选取第 3 个元素作为 `base` ,执行插入操作后,**数组的前 3 个元素已排序**。
3. 以此类推,在最后一轮中,选取数组尾元素作为 `base` ,执行插入操作后,**所有元素均已排序**。
2023-02-08 15:20:18 +08:00
2023-02-26 18:17:57 +08:00
![插入排序流程](insertion_sort.assets/insertion_sort_overview.png)
2023-02-08 15:20:18 +08:00
2023-02-26 19:53:26 +08:00
<p align="center"> Fig. 插入排序流程 </p>
2023-02-08 15:20:18 +08:00
=== "Java"
```java title="insertion_sort.java"
/* 插入排序 */
void insertionSort(int[] nums) {
// 外循环base = nums[1], nums[2], ..., nums[n-1]
for (int i = 1; i < nums.length; i++) {
int base = nums[i], j = i - 1;
// 内循环:将 base 插入到左边的正确位置
while (j >= 0 && nums[j] > base) {
2023-04-14 04:01:38 +08:00
nums[j + 1] = nums[j]; // 1. 将 nums[j] 向右移动一位
2023-02-08 15:20:18 +08:00
j--;
}
2023-04-14 04:01:38 +08:00
nums[j + 1] = base; // 2. 将 base 赋值到正确位置
2023-02-08 15:20:18 +08:00
}
}
```
=== "C++"
```cpp title="insertion_sort.cpp"
/* 插入排序 */
2023-04-14 04:01:38 +08:00
void insertionSort(vector<int> &nums) {
2023-02-08 15:20:18 +08:00
// 外循环base = nums[1], nums[2], ..., nums[n-1]
for (int i = 1; i < nums.size(); i++) {
int base = nums[i], j = i - 1;
// 内循环:将 base 插入到左边的正确位置
while (j >= 0 && nums[j] > base) {
2023-04-14 04:01:38 +08:00
nums[j + 1] = nums[j]; // 1. 将 nums[j] 向右移动一位
2023-02-08 15:20:18 +08:00
j--;
}
2023-04-14 04:01:38 +08:00
nums[j + 1] = base; // 2. 将 base 赋值到正确位置
2023-02-08 15:20:18 +08:00
}
}
```
=== "Python"
```python title="insertion_sort.py"
2023-03-23 18:56:56 +08:00
def insertion_sort(nums: list[int]) -> None:
2023-04-09 05:12:22 +08:00
"""插入排序"""
# 外循环base = nums[1], nums[2], ..., nums[n-1]
2023-02-08 15:20:18 +08:00
for i in range(1, len(nums)):
2023-03-12 18:46:03 +08:00
base: int = nums[i]
j: int = i - 1
2023-02-08 15:20:18 +08:00
# 内循环:将 base 插入到左边的正确位置
while j >= 0 and nums[j] > base:
nums[j + 1] = nums[j] # 1. 将 nums[j] 向右移动一位
j -= 1
2023-04-09 05:12:22 +08:00
nums[j + 1] = base # 2. 将 base 赋值到正确位置
2023-02-08 15:20:18 +08:00
```
=== "Go"
```go title="insertion_sort.go"
/* 插入排序 */
func insertionSort(nums []int) {
// 外循环:待排序元素数量为 n-1, n-2, ..., 1
for i := 1; i < len(nums); i++ {
base := nums[i]
j := i - 1
// 内循环:将 base 插入到左边的正确位置
for j >= 0 && nums[j] > base {
2023-02-09 04:43:12 +08:00
nums[j+1] = nums[j] // 1. 将 nums[j] 向右移动一位
2023-02-08 15:20:18 +08:00
j--
}
2023-02-09 04:43:12 +08:00
nums[j+1] = base // 2. 将 base 赋值到正确位置
2023-02-08 15:20:18 +08:00
}
}
```
=== "JavaScript"
```javascript title="insertion_sort.js"
/* 插入排序 */
function insertionSort(nums) {
// 外循环base = nums[1], nums[2], ..., nums[n-1]
for (let i = 1; i < nums.length; i++) {
let base = nums[i], j = i - 1;
// 内循环:将 base 插入到左边的正确位置
while (j >= 0 && nums[j] > base) {
nums[j + 1] = nums[j]; // 1. 将 nums[j] 向右移动一位
j--;
}
nums[j + 1] = base; // 2. 将 base 赋值到正确位置
}
}
```
=== "TypeScript"
```typescript title="insertion_sort.ts"
/* 插入排序 */
function insertionSort(nums: number[]): void {
// 外循环base = nums[1], nums[2], ..., nums[n-1]
for (let i = 1; i < nums.length; i++) {
const base = nums[i];
let j = i - 1;
// 内循环:将 base 插入到左边的正确位置
while (j >= 0 && nums[j] > base) {
2023-02-08 16:47:52 +08:00
nums[j + 1] = nums[j]; // 1. 将 nums[j] 向右移动一位
2023-02-08 15:20:18 +08:00
j--;
}
2023-02-08 16:47:52 +08:00
nums[j + 1] = base; // 2. 将 base 赋值到正确位置
2023-02-08 15:20:18 +08:00
}
}
```
=== "C"
```c title="insertion_sort.c"
2023-02-11 18:21:44 +08:00
[class]{}-[func]{insertionSort}
2023-02-08 15:20:18 +08:00
```
=== "C#"
```csharp title="insertion_sort.cs"
/* 插入排序 */
void insertionSort(int[] nums)
{
// 外循环base = nums[1], nums[2], ..., nums[n-1]
for (int i = 1; i < nums.Length; i++)
{
int bas = nums[i], j = i - 1;
// 内循环:将 base 插入到左边的正确位置
while (j >= 0 && nums[j] > bas)
{
nums[j + 1] = nums[j]; // 1. 将 nums[j] 向右移动一位
j--;
}
nums[j + 1] = bas; // 2. 将 base 赋值到正确位置
}
}
```
=== "Swift"
```swift title="insertion_sort.swift"
/* 插入排序 */
func insertionSort(nums: inout [Int]) {
// 外循环base = nums[1], nums[2], ..., nums[n-1]
for i in stride(from: 1, to: nums.count, by: 1) {
let base = nums[i]
var j = i - 1
// 内循环:将 base 插入到左边的正确位置
while j >= 0, nums[j] > base {
nums[j + 1] = nums[j] // 1. 将 nums[j] 向右移动一位
j -= 1
}
nums[j + 1] = base // 2. 将 base 赋值到正确位置
}
}
```
=== "Zig"
```zig title="insertion_sort.zig"
2023-02-09 22:55:29 +08:00
// 插入排序
fn insertionSort(nums: []i32) void {
// 外循环base = nums[1], nums[2], ..., nums[n-1]
var i: usize = 1;
while (i < nums.len) : (i += 1) {
var base = nums[i];
var j: usize = i;
// 内循环:将 base 插入到左边的正确位置
while (j >= 1 and nums[j - 1] > base) : (j -= 1) {
nums[j] = nums[j - 1]; // 1. 将 nums[j] 向右移动一位
}
nums[j] = base; // 2. 将 base 赋值到正确位置
}
}
2023-02-08 15:20:18 +08:00
```
2023-02-24 18:45:27 +08:00
## 11.3.2. &nbsp; 算法特性
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
**时间复杂度 $O(n^2)$** :最差情况下,每次插入操作分别需要循环 $n - 1$ , $n-2$ , $\cdots$ , $2$ , $1$ 次,求和得到 $\frac{(n - 1) n}{2}$ ,因此时间复杂度为 $O(n^2)$ 。当输入数组完全有序时,插入排序达到最佳时间复杂度 $O(n)$ ,因此是“自适应排序”。
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
**空间复杂度 $O(1)$** :指针 $i$ , $j$ 使用常数大小的额外空间,所以插入排序是“原地排序”。
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
在插入操作过程中,我们会将元素插入到相等元素的右侧,不会改变它们的顺序,因此是“稳定排序”。
2023-02-08 15:20:18 +08:00
2023-03-26 22:05:35 +08:00
## 11.3.3. &nbsp; 插入排序优势
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
回顾冒泡排序和插入排序的复杂度分析,两者的循环轮数都是 $\frac{(n - 1) n}{2}$ 。然而,它们之间存在以下差异:
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
- 冒泡操作基于元素交换实现,需要借助一个临时变量,共涉及 3 个单元操作;
- 插入操作基于元素赋值实现,仅需 1 个单元操作;
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
粗略估计下来,冒泡排序的计算开销约为插入排序的 3 倍,因此插入排序更受欢迎。实际上,许多编程语言(如 Java的内置排序函数都采用了插入排序大致思路为
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
- 对于长数组,采用基于分治的排序算法,例如「快速排序」,时间复杂度为 $O(n \log n)$
- 对于短数组,直接使用「插入排序」,时间复杂度为 $O(n^2)$
2023-02-08 15:20:18 +08:00
2023-04-10 03:12:02 +08:00
尽管插入排序的时间复杂度高于快速排序,**但在数据量较小的情况下,插入排序实际上更快**。这是因为在数据量较小时,复杂度中的常数项(即每轮中的单元操作数量)起主导作用。这个现象与「线性查找」和「二分查找」的情况相似。