2023-02-16 03:39:01 +08:00
|
|
|
|
# 算法效率评估
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
在算法设计中,我们先后追求以下两个层面的目标。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-08 23:16:33 +08:00
|
|
|
|
1. **找到问题解法**:算法需要在规定的输入范围内,可靠地求得问题的正确解。
|
|
|
|
|
2. **寻求最优解法**:同一个问题可能存在多种解法,我们希望找到尽可能高效的算法。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
因此,在能够解决问题的前提下,算法效率已成为衡量算法优劣的主要评价指标,它包括以下两个维度。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-17 05:13:19 +08:00
|
|
|
|
- **时间效率**:算法运行速度的快慢。
|
|
|
|
|
- **空间效率**:算法占用内存空间的大小。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-17 05:13:19 +08:00
|
|
|
|
简而言之,**我们的目标是设计“既快又省”的数据结构与算法**。而有效地评估算法效率至关重要,因为只有这样我们才能将各种算法进行对比,从而指导算法设计与优化过程。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-10 11:35:16 +08:00
|
|
|
|
效率评估方法主要分为两种:实际测试和理论估算。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-10 11:35:16 +08:00
|
|
|
|
## 实际测试
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-08 23:16:33 +08:00
|
|
|
|
假设我们现在有算法 `A` 和算法 `B` ,它们都能解决同一问题,现在需要对比这两个算法的效率。最直接的方法是找一台计算机,运行这两个算法,并监控记录它们的运行时间和内存占用情况。这种评估方式能够反映真实情况,但也存在较大局限性。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
一方面,**难以排除测试环境的干扰因素**。硬件配置会影响算法的性能表现。比如在某台计算机中,算法 `A` 的运行时间比算法 `B` 短;但在另一台配置不同的计算机中,我们可能得到相反的测试结果。这意味着我们需要在各种机器上进行测试,统计平均效率,而这是不现实的。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
另一方面,**展开完整测试非常耗费资源**。随着输入数据量的变化,算法会表现出不同的效率。例如,在输入数据量较小时,算法 `A` 的运行时间比算法 `B` 更少;而输入数据量较大时,测试结果可能恰恰相反。因此,为了得到有说服力的结论,我们需要测试各种规模的输入数据,而这样需要耗费大量的计算资源。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-10 11:35:16 +08:00
|
|
|
|
## 理论估算
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
由于实际测试具有较大的局限性,我们可以考虑仅通过一些计算来评估算法的效率。这种估算方法被称为「渐近复杂度分析 asymptotic complexity analysis」,简称「复杂度分析」。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
复杂度分析评估的是算法运行所需的时间和空间资源,**它描述了随着输入数据大小的增加,算法所需时间(空间)的增长趋势**。这个定义有些拗口,我们可以将其分为三个重点来理解。
|
2023-02-09 00:56:37 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
1. “时间和空间资源”分别对应「时间复杂度 time complexity」和「空间复杂度 space complexity」。
|
2023-08-20 13:37:49 +08:00
|
|
|
|
2. “随着输入数据大小的增加”意味着复杂度反映了算法运行效率与输入数据体量之间的关系。
|
2023-08-17 05:13:19 +08:00
|
|
|
|
3. “增长趋势”表示复杂度分析关注的是算法时间与空间的增长趋势,而非具体的运行时间或占用空间。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-17 05:13:19 +08:00
|
|
|
|
**复杂度分析克服了实际测试方法的弊端**。首先,它独立于测试环境,分析结果适用于所有运行平台。其次,它可以体现不同数据量下的算法效率,尤其是在大数据量下的算法性能。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
如果你对复杂度分析的概念仍感到困惑,无须担心,我们会在后续章节中详细介绍。
|
2023-02-09 00:56:37 +08:00
|
|
|
|
|
2023-08-08 23:16:33 +08:00
|
|
|
|
## 复杂度的重要性
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-08 23:16:33 +08:00
|
|
|
|
复杂度分析为我们提供了一把评估算法效率的“标尺”,帮助我们衡量了执行某个算法所需的时间和空间资源,并使我们能够对比不同算法之间的效率。
|
2022-11-22 17:47:26 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
复杂度是个数学概念,对于初学者可能比较抽象,学习难度相对较高。从这个角度看,复杂度分析可能不太适合作为第 1 章的内容。
|
2023-08-08 23:16:33 +08:00
|
|
|
|
|
2023-08-20 14:51:39 +08:00
|
|
|
|
然而,当我们讨论某个数据结构或算法的特点时,难以避免要分析其运行速度和空间使用情况。因此,在深入学习数据结构与算法之前,**建议你先对复杂度建立初步的了解,以便能够完成简单算法的复杂度分析**。
|