2023-04-17 21:01:06 +08:00
|
|
|
# 二叉树数组表示
|
|
|
|
|
2023-12-02 06:21:34 +08:00
|
|
|
在链表表示下,二叉树的存储单元为节点 `TreeNode` ,节点之间通过指针相连接。上一节介绍了链表表示下的二叉树的各项基本操作。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-08-20 23:28:30 +08:00
|
|
|
那么,我们能否用数组来表示二叉树呢?答案是肯定的。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
|
|
|
## 表示完美二叉树
|
|
|
|
|
2023-12-02 06:21:34 +08:00
|
|
|
先分析一个简单案例。给定一棵完美二叉树,我们将所有节点按照层序遍历的顺序存储在一个数组中,则每个节点都对应唯一的数组索引。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-12-02 06:21:34 +08:00
|
|
|
根据层序遍历的特性,我们可以推导出父节点索引与子节点索引之间的“映射公式”:**若某节点的索引为 $i$ ,则该节点的左子节点索引为 $2i + 1$ ,右子节点索引为 $2i + 2$** 。下图展示了各个节点索引之间的映射关系。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-06-17 00:45:41 +08:00
|
|
|
![完美二叉树的数组表示](array_representation_of_tree.assets/array_representation_binary_tree.png)
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2024-04-01 19:37:00 +08:00
|
|
|
**映射公式的角色相当于链表中的节点引用(指针)**。给定数组中的任意一个节点,我们都可以通过映射公式来访问它的左(右)子节点。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
|
|
|
## 表示任意二叉树
|
|
|
|
|
2023-12-28 18:06:09 +08:00
|
|
|
完美二叉树是一个特例,在二叉树的中间层通常存在许多 `None` 。由于层序遍历序列并不包含这些 `None` ,因此我们无法仅凭该序列来推测 `None` 的数量和分布位置。**这意味着存在多种二叉树结构都符合该层序遍历序列**。
|
2023-08-21 19:33:45 +08:00
|
|
|
|
2023-12-02 06:21:34 +08:00
|
|
|
如下图所示,给定一棵非完美二叉树,上述数组表示方法已经失效。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-06-17 00:45:41 +08:00
|
|
|
![层序遍历序列对应多种二叉树可能性](array_representation_of_tree.assets/array_representation_without_empty.png)
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-12-28 18:06:09 +08:00
|
|
|
为了解决此问题,**我们可以考虑在层序遍历序列中显式地写出所有 `None`** 。如下图所示,这样处理后,层序遍历序列就可以唯一表示二叉树了。示例代码如下:
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
=== "Python"
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
```python title=""
|
|
|
|
# 二叉树的数组表示
|
|
|
|
# 使用 None 来表示空位
|
|
|
|
tree = [1, 2, 3, 4, None, 6, 7, 8, 9, None, None, 12, None, None, 15]
|
2023-04-17 21:01:06 +08:00
|
|
|
```
|
|
|
|
|
|
|
|
=== "C++"
|
|
|
|
|
|
|
|
```cpp title=""
|
|
|
|
/* 二叉树的数组表示 */
|
2023-07-19 16:09:27 +08:00
|
|
|
// 使用 int 最大值 INT_MAX 标记空位
|
2023-04-18 20:21:31 +08:00
|
|
|
vector<int> tree = {1, 2, 3, 4, INT_MAX, 6, 7, 8, 9, INT_MAX, INT_MAX, 12, INT_MAX, INT_MAX, 15};
|
2023-04-17 21:01:06 +08:00
|
|
|
```
|
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
=== "Java"
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
```java title=""
|
|
|
|
/* 二叉树的数组表示 */
|
|
|
|
// 使用 int 的包装类 Integer ,就可以使用 null 来标记空位
|
|
|
|
Integer[] tree = { 1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15 };
|
|
|
|
```
|
|
|
|
|
|
|
|
=== "C#"
|
|
|
|
|
|
|
|
```csharp title=""
|
|
|
|
/* 二叉树的数组表示 */
|
|
|
|
// 使用 int? 可空类型 ,就可以使用 null 来标记空位
|
2023-11-26 23:18:44 +08:00
|
|
|
int?[] tree = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15];
|
2023-04-17 21:01:06 +08:00
|
|
|
```
|
|
|
|
|
|
|
|
=== "Go"
|
|
|
|
|
|
|
|
```go title=""
|
|
|
|
/* 二叉树的数组表示 */
|
|
|
|
// 使用 any 类型的切片, 就可以使用 nil 来标记空位
|
|
|
|
tree := []any{1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15}
|
|
|
|
```
|
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
=== "Swift"
|
|
|
|
|
|
|
|
```swift title=""
|
|
|
|
/* 二叉树的数组表示 */
|
|
|
|
// 使用 Int? 可空类型 ,就可以使用 nil 来标记空位
|
|
|
|
let tree: [Int?] = [1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15]
|
|
|
|
```
|
|
|
|
|
2023-07-26 15:35:38 +08:00
|
|
|
=== "JS"
|
2023-04-17 21:01:06 +08:00
|
|
|
|
|
|
|
```javascript title=""
|
|
|
|
/* 二叉树的数组表示 */
|
2023-07-24 03:04:55 +08:00
|
|
|
// 使用 null 来表示空位
|
2023-04-17 21:01:06 +08:00
|
|
|
let tree = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15];
|
|
|
|
```
|
|
|
|
|
2023-07-26 15:35:38 +08:00
|
|
|
=== "TS"
|
2023-04-17 21:01:06 +08:00
|
|
|
|
|
|
|
```typescript title=""
|
|
|
|
/* 二叉树的数组表示 */
|
2023-07-24 03:04:55 +08:00
|
|
|
// 使用 null 来表示空位
|
2023-04-17 21:01:06 +08:00
|
|
|
let tree: (number | null)[] = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15];
|
|
|
|
```
|
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
=== "Dart"
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
```dart title=""
|
2023-04-17 21:01:06 +08:00
|
|
|
/* 二叉树的数组表示 */
|
|
|
|
// 使用 int? 可空类型 ,就可以使用 null 来标记空位
|
2023-09-04 03:19:08 +08:00
|
|
|
List<int?> tree = [1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15];
|
2023-04-17 21:01:06 +08:00
|
|
|
```
|
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
=== "Rust"
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
```rust title=""
|
2023-10-01 19:25:03 +08:00
|
|
|
/* 二叉树的数组表示 */
|
|
|
|
// 使用 None 来标记空位
|
|
|
|
let tree = [Some(1), Some(2), Some(3), Some(4), None, Some(6), Some(7), Some(8), Some(9), None, None, Some(12), None, None, Some(15)];
|
2023-04-17 21:01:06 +08:00
|
|
|
```
|
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
=== "C"
|
2023-06-02 02:40:26 +08:00
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
```c title=""
|
2023-06-02 14:56:29 +08:00
|
|
|
/* 二叉树的数组表示 */
|
2023-09-04 03:19:08 +08:00
|
|
|
// 使用 int 最大值标记空位,因此要求节点值不能为 INT_MAX
|
|
|
|
int tree[] = {1, 2, 3, 4, INT_MAX, 6, 7, 8, 9, INT_MAX, INT_MAX, 12, INT_MAX, INT_MAX, 15};
|
2023-06-02 02:40:26 +08:00
|
|
|
```
|
|
|
|
|
2024-03-25 03:15:36 +08:00
|
|
|
=== "Kotlin"
|
|
|
|
|
|
|
|
```kotlin title=""
|
2024-03-30 13:16:39 +08:00
|
|
|
/* 二叉树的数组表示 */
|
|
|
|
// 使用 null 来表示空位
|
2024-04-13 20:09:39 +08:00
|
|
|
val tree = arrayOf( 1, 2, 3, 4, null, 6, 7, 8, 9, null, null, 12, null, null, 15 )
|
2024-03-25 03:15:36 +08:00
|
|
|
```
|
|
|
|
|
2024-03-31 03:57:11 +08:00
|
|
|
=== "Ruby"
|
|
|
|
|
|
|
|
```ruby title=""
|
2024-04-19 23:42:20 +08:00
|
|
|
### 二叉树的数组表示 ###
|
|
|
|
# 使用 nil 来表示空位
|
|
|
|
tree = [1, 2, 3, 4, nil, 6, 7, 8, 9, nil, nil, 12, nil, nil, 15]
|
2024-03-31 03:57:11 +08:00
|
|
|
```
|
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
=== "Zig"
|
2023-07-26 11:00:53 +08:00
|
|
|
|
2023-09-04 03:19:08 +08:00
|
|
|
```zig title=""
|
2023-07-26 11:00:53 +08:00
|
|
|
|
|
|
|
```
|
|
|
|
|
2023-06-17 00:45:41 +08:00
|
|
|
![任意类型二叉树的数组表示](array_representation_of_tree.assets/array_representation_with_empty.png)
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-12-28 18:06:09 +08:00
|
|
|
值得说明的是,**完全二叉树非常适合使用数组来表示**。回顾完全二叉树的定义,`None` 只出现在最底层且靠右的位置,**因此所有 `None` 一定出现在层序遍历序列的末尾**。
|
2023-08-21 19:33:45 +08:00
|
|
|
|
2023-12-28 18:06:09 +08:00
|
|
|
这意味着使用数组表示完全二叉树时,可以省略存储所有 `None` ,非常方便。下图给出了一个例子。
|
2023-07-19 16:09:27 +08:00
|
|
|
|
2023-07-24 03:04:55 +08:00
|
|
|
![完全二叉树的数组表示](array_representation_of_tree.assets/array_representation_complete_binary_tree.png)
|
|
|
|
|
2023-12-02 06:21:34 +08:00
|
|
|
以下代码实现了一棵基于数组表示的二叉树,包括以下几种操作。
|
2023-07-24 03:04:55 +08:00
|
|
|
|
2023-07-26 08:59:36 +08:00
|
|
|
- 给定某节点,获取它的值、左(右)子节点、父节点。
|
|
|
|
- 获取前序遍历、中序遍历、后序遍历、层序遍历序列。
|
2023-07-19 16:09:27 +08:00
|
|
|
|
2023-10-17 01:06:00 +08:00
|
|
|
```src
|
|
|
|
[file]{array_binary_tree}-[class]{array_binary_tree}-[func]{}
|
|
|
|
```
|
2023-07-19 16:09:27 +08:00
|
|
|
|
2023-12-02 06:21:34 +08:00
|
|
|
## 优点与局限性
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-08-27 22:49:47 +08:00
|
|
|
二叉树的数组表示主要有以下优点。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-07-26 08:59:36 +08:00
|
|
|
- 数组存储在连续的内存空间中,对缓存友好,访问与遍历速度较快。
|
|
|
|
- 不需要存储指针,比较节省空间。
|
|
|
|
- 允许随机访问节点。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-08-27 22:49:47 +08:00
|
|
|
然而,数组表示也存在一些局限性。
|
2023-04-17 21:01:06 +08:00
|
|
|
|
2023-07-26 08:59:36 +08:00
|
|
|
- 数组存储需要连续内存空间,因此不适合存储数据量过大的树。
|
|
|
|
- 增删节点需要通过数组插入与删除操作实现,效率较低。
|
2023-12-28 18:06:09 +08:00
|
|
|
- 当二叉树中存在大量 `None` 时,数组中包含的节点数据比重较低,空间利用率较低。
|