hello-algo/docs/chapter_tree/array_representation_of_tree.md
krahets b39c2a94d3 Move docs/zh back to docs.
Move docs/overrides to overrides/.
Other fine tunes.
2023-10-08 04:25:06 +08:00

6.8 KiB

二叉树数组表示

在链表表示下,二叉树的存储单元为节点 TreeNode ,节点之间通过指针相连接。在上节中,我们学习了在链表表示下的二叉树的各项基本操作。

那么,我们能否用数组来表示二叉树呢?答案是肯定的。

表示完美二叉树

先分析一个简单案例。给定一个完美二叉树,我们将所有节点按照层序遍历的顺序存储在一个数组中,则每个节点都对应唯一的数组索引。

根据层序遍历的特性,我们可以推导出父节点索引与子节点索引之间的“映射公式”:若节点的索引为 i ,则该节点的左子节点索引为 2i + 1 ,右子节点索引为 $2i + 2$ 。下图展示了各个节点索引之间的映射关系。

完美二叉树的数组表示

映射公式的角色相当于链表中的指针。给定数组中的任意一个节点,我们都可以通过映射公式来访问它的左(右)子节点。

表示任意二叉树

完美二叉树是一个特例,在二叉树的中间层通常存在许多 \text{None} 。由于层序遍历序列并不包含这些 \text{None} ,因此我们无法仅凭该序列来推测 \text{None} 的数量和分布位置。这意味着存在多种二叉树结构都符合该层序遍历序列

如下图所示,给定一个非完美二叉树,上述的数组表示方法已经失效。

层序遍历序列对应多种二叉树可能性

为了解决此问题,我们可以考虑在层序遍历序列中显式地写出所有 $\text{None}$ 。如下图所示,这样处理后,层序遍历序列就可以唯一表示二叉树了。

=== "Python"

```python title=""
# 二叉树的数组表示
# 使用 None 来表示空位
tree = [1, 2, 3, 4, None, 6, 7, 8, 9, None, None, 12, None, None, 15]
```

=== "C++"

```cpp title=""
/* 二叉树的数组表示 */
// 使用 int 最大值 INT_MAX 标记空位
vector<int> tree = {1, 2, 3, 4, INT_MAX, 6, 7, 8, 9, INT_MAX, INT_MAX, 12, INT_MAX, INT_MAX, 15};
```

=== "Java"

```java title=""
/* 二叉树的数组表示 */
// 使用 int 的包装类 Integer ,就可以使用 null 来标记空位
Integer[] tree = { 1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15 };
```

=== "C#"

```csharp title=""
/* 二叉树的数组表示 */
// 使用 int? 可空类型 ,就可以使用 null 来标记空位
int?[] tree = { 1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15 };
```

=== "Go"

```go title=""
/* 二叉树的数组表示 */
// 使用 any 类型的切片, 就可以使用 nil 来标记空位
tree := []any{1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15}
```

=== "Swift"

```swift title=""
/* 二叉树的数组表示 */
// 使用 Int? 可空类型 ,就可以使用 nil 来标记空位
let tree: [Int?] = [1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15]
```

=== "JS"

```javascript title=""
/* 二叉树的数组表示 */
// 使用 null 来表示空位
let tree = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15];
```

=== "TS"

```typescript title=""
/* 二叉树的数组表示 */
// 使用 null 来表示空位
let tree: (number | null)[] = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15];
```

=== "Dart"

```dart title=""
/* 二叉树的数组表示 */
// 使用 int? 可空类型 ,就可以使用 null 来标记空位
List<int?> tree = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15];
```

=== "Rust"

```rust title=""
/* 二叉树的数组表示 */
// 使用 None 来标记空位
let tree = [Some(1), Some(2), Some(3), Some(4), None, Some(6), Some(7), Some(8), Some(9), None, None, Some(12), None, None, Some(15)];
```

=== "C"

```c title=""
/* 二叉树的数组表示 */
// 使用 int 最大值标记空位,因此要求节点值不能为 INT_MAX
int tree[] = {1, 2, 3, 4, INT_MAX, 6, 7, 8, 9, INT_MAX, INT_MAX, 12, INT_MAX, INT_MAX, 15};
```

=== "Zig"

```zig title=""

```

任意类型二叉树的数组表示

值得说明的是,完全二叉树非常适合使用数组来表示。回顾完全二叉树的定义,\text{None} 只出现在最底层且靠右的位置,因此所有 \text{None} 一定出现在层序遍历序列的末尾

这意味着使用数组表示完全二叉树时,可以省略存储所有 \text{None} ,非常方便。下图给出了一个例子。

完全二叉树的数组表示

以下代码实现了一个基于数组表示的二叉树,包括以下几种操作。

  • 给定某节点,获取它的值、左(右)子节点、父节点。
  • 获取前序遍历、中序遍历、后序遍历、层序遍历序列。

=== "Python"

```python title="array_binary_tree.py"
[class]{ArrayBinaryTree}-[func]{}
```

=== "C++"

```cpp title="array_binary_tree.cpp"
[class]{ArrayBinaryTree}-[func]{}
```

=== "Java"

```java title="array_binary_tree.java"
[class]{ArrayBinaryTree}-[func]{}
```

=== "C#"

```csharp title="array_binary_tree.cs"
[class]{ArrayBinaryTree}-[func]{}
```

=== "Go"

```go title="array_binary_tree.go"
[class]{arrayBinaryTree}-[func]{}
```

=== "Swift"

```swift title="array_binary_tree.swift"
[class]{ArrayBinaryTree}-[func]{}
```

=== "JS"

```javascript title="array_binary_tree.js"
[class]{ArrayBinaryTree}-[func]{}
```

=== "TS"

```typescript title="array_binary_tree.ts"
[class]{ArrayBinaryTree}-[func]{}
```

=== "Dart"

```dart title="array_binary_tree.dart"
[class]{ArrayBinaryTree}-[func]{}
```

=== "Rust"

```rust title="array_binary_tree.rs"
[class]{ArrayBinaryTree}-[func]{}
```

=== "C"

```c title="array_binary_tree.c"
[class]{arrayBinaryTree}-[func]{}
```

=== "Zig"

```zig title="array_binary_tree.zig"
[class]{ArrayBinaryTree}-[func]{}
```

优势与局限性

二叉树的数组表示主要有以下优点。

  • 数组存储在连续的内存空间中,对缓存友好,访问与遍历速度较快。
  • 不需要存储指针,比较节省空间。
  • 允许随机访问节点。

然而,数组表示也存在一些局限性。

  • 数组存储需要连续内存空间,因此不适合存储数据量过大的树。
  • 增删节点需要通过数组插入与删除操作实现,效率较低。
  • 当二叉树中存在大量 \text{None} 时,数组中包含的节点数据比重较低,空间利用率较低。