Master Theorem

If $T (n) = a T (\frac{n}{b}) + O (n^{d})$ , then $T (n) = {\begin{cases} O (n^{d}) & a < b^{d} \\ O (n^{\log_{b} a}) & a > b^{d} \\ O (n^{d} \log n) & a = b^{d} \end{cases}$

证明思路 / 推导过程

对于递推式 $T (n) = a T (\frac{n}{b}) + O (n^{d})$ ：

递归深度：共有 $\log_{b} n$ 层。
每层合并代价（Combine Cost）： $O (n^{d})$ 。
具体到各层代价：
- 第 0 层： $O (n^{d})$
- 第 1 层： $a \cdot O ({(\frac{n}{b})}^{d}) = (\frac{a}{b^{d}}) O (n^{d})$
- 第 2 层： $a^{2} \cdot O ({(\frac{n}{b^{2}})}^{d}) = {(\frac{a}{b^{d}})}^{2} O (n^{d})$
- ...
- 第 $\log_{b} n$ 层： $a^{\log_{b} n} \cdot O (1) = O (n^{\log_{b} a})$

总代价：

T (n) = O (n^{d}) [1 + (\frac{a}{b^{d}}) + {(\frac{a}{b^{d}})}^{2} + \dots + {(\frac{a}{b^{d}})}^{\log_{b} n}]

这是一个公比为 $r = \frac{a}{b^{d}}$ 的等比数列：

若 $a < b^{d}$ ( $r < 1$ )：数列收敛，总和由第一项（根节点）主导： $T (n) \sim O (n^{d})$
若 $a > b^{d}$ ( $r > 1$ )：数列发散，总和由最后一项（叶子节点）主导： $T (n) = O (n^{d}) \cdot \frac{{(\frac{a}{b^{d}})}^{\log_{b} n + 1} - 1}{\frac{a}{b^{d}} - 1} = O (n^{\log_{b} a})$
若 $a = b^{d}$ ( $r = 1$ )：每层代价相等，共有 $\log_{b} n + 1$ 层： $T (n) = O (n^{d} \log_{b} n)$

应用实例：寻找第 k 小的数 (QuickSelect)

使用快排（QuickSort）的思路：先进行一次 Partition，找到第 1 个位置 $O (n)$ ，然后根据 $k$ 的位置选择其中一边进行递归。

1. 最坏情况 (Worst Case)

如果每次选出的 pivot 只能筛掉一个元素（例如数组已排序且选第一个元素为 pivot）：

T (n) \leq O (n) + T (n - 1)

T (n) = O (n) + O (n - 1) + \dots + O (1) = O (n^{2})

这种情况非常糟糕。

2. 平均情况 (Average Case)

我们可以通过概率分析来观察平均性能。定义“好运气”和“坏运气”：

Good luck：划分后的子问题规模 $\leq \frac{3}{4} n$ 。
Bad luck：划分后的子问题规模 $> \frac{3}{4} n$ 。

在随机选择 pivot 的情况下，落在中间 $[\frac{1}{4} n, \frac{3}{4} n]$ 范围内的概率为 $1 / 2$ （即 Good luck 的概率 $p = 1 / 2$ ）。

推导过程：设 $τ (n)$ 为将规模从 $n$ 缩减到 $\frac{3}{4} n$ 所需的操作次数。因为每次划分有 $1 / 2$ 的概率成功缩减，所以 $τ (n)$ 服从参数为 $1 / 2$ 的几何分布：

E [τ (n)] = 2 \cdot O (n) = O (n)

递归期望代价：

E [T (n)] = E [τ (n) + T (\frac{3}{4} n)]

E [T (n)] = O (n) + E [T (\frac{3}{4} n)]

展开级数：

E [T (n)] = O (n) [1 + \frac{3}{4} + {(\frac{3}{4})}^{2} + \dots]

由于这是一个公比为 $3 / 4 < 1$ 的收敛等比数列：

E [T (n)] = O (n)

结论：QuickSelect 的平均时间复杂度为 $O (n)$ 。

3. 如何选择一个好的 Pivot？ (Median of Medians)

随机化分析的缺点：随机性太强，虽然期望是 $O (n)$ ，但存在最坏情况，且分析达到 $O (n)$ 的概率分布比较麻烦。

我们希望寻找一种确定性的方法来选择 pivot，使得：

T (n) = T (c \cdot n) + findpivot + O (n)

启发式方法：中位数的中位数 (BFPTR 算法)

将 $n$ 个数分为 $⌈ n / 5 ⌉$ 组，每组 5 个数。
找出每组的中位数，总耗时 $O (n)$ 。
递归地找出这 $n / 5$ 个中位数的中位数，记为 $x$ 。此步骤代价为 $T (n / 5)$ 。

Pivot 的质量保证

根据“中位数的中位数”的性质，至少有 $3 / 10$ 的元素比 $x$ 大，同时也至少有 $3 / 10$ 的元素比 $x$ 小。因此，划分后剩下的子问题规模最大为 $7 n / 10$ 。

由此得到递推式：

T (n) = T (n / 5) + T (7 n / 10) + O (n)

复杂度证明

方法一：递归树分析

Level 0: $n$
Level 1: $0.2 n + 0.7 n = 0.9 n$
Level 2: $(0.2 + 0.7) \cdot 0.9 n = 0.81 n$
...
Level $k$ : ${0.9}^{k} n$

总代价为公比为 $0.9$ 的等比级数：

T (n) = n \sum_{k = 0}^{\infty} (0.9)^{k} = \frac{n}{1 - 0.9} = 10 n = O (n)

方法二：归纳法 (代入法) 假设 $T (n) \leq B n$ ：

T (n) = T (0.2 n) + T (0.7 n) + C n

T (n) \leq 0.2 B n + 0.7 B n + C n = 0.9 B n + C n

若要满足 $0.9 B n + C n \leq B n$ ，则需 $C n \leq 0.1 B n$ ，即 $B \geq 10 C$ 。

实际评价：虽然理论上是确定的 $O (n)$ ，但由于常数项 $B$ 较大，实际运行速度往往不如随机取 pivot 的 QuickSelect。

4. 深入讨论：为什么选择 5 作为分组大小？

在 BFPTR 算法中，分组大小 $g$ 的选择至关重要。

(1) 为什么选择奇数？

选择奇数是因为在对每组进行排序后，中位数是唯一的（即正中间的那个位置）。如果选择偶数（如 4 或 6），则需要规定取左中位数或右中位数，增加了逻辑复杂度。

(2) 为什么是 5 而不是 3？

从递推式出发，设分组大小为 $g$ （ $g$ 为奇数）。

寻找中位数的中位数需要 $T (n / g)$ 。
划分后，根据“中位数的中位数”的几何性质，能够排除的元素个数约为 $\frac{1}{2} \cdot \frac{g + 1}{2} \cdot \frac{n}{g} = \frac{g + 1}{4 g} n$ 。
剩余的子问题规模为 $n - \frac{g + 1}{4 g} n = \frac{3 g - 1}{4 g} n$ 。

得到递推式：

T (n) = T (\frac{1}{g} n) + T (\frac{3 g - 1}{4 g} n) + O (n)

为了使 $T (n) = O (n)$ ，必须满足两个系数之和小于 1：

\frac{1}{g} + \frac{3 g - 1}{4 g} < 1

解不等式：

\frac{4 + 3 g - 1}{4 g} < 1 ⟹ \frac{3 g + 3}{4 g} < 1 ⟹ 3 g + 3 < 4 g ⟹ g > 3

若 $g = 3$ ：系数之和 $\frac{1}{3} + \frac{2}{3} = 1$ 。此时递推式变为 $O (n \log n)$ ，无法达到线性复杂度。
若 $g = 5$ ：系数之和 $\frac{1}{5} + \frac{7}{10} = \frac{9}{10} = 0.9 < 1$ 。这是满足线性复杂度的最小奇数。

(3) 为什么是 5 而不是 7 或更大？

虽然从数学上看， $g$ 越大，剩余子题目的规模比例越小（例如 $g = 7$ 时，系数之和约为 $0.857 < 0.9$ ），但实际算法开销由两部分组成：

递归子问题的规模（随 $g$ 增大而减小）。
寻找每组中位数的时间开销（随 $g$ 增大而显著增加）。

开销分析：

当 $g = 5$ 时：寻找 5 个数的中位数非常快，只需要最多 6 次比较。
当 $g = 7$ 时：寻找 7 个数的中位数所需的比较次数和操作复杂度会显著上升。

随着 $g$ 的增大，我们在每一层递归中为了“选出更好的 pivot”所付出的 $O (n)$ 预处理代价（即常数项 $C$ ）会迅速膨胀，这会抵消掉子问题规模缩小带来的收益。

结论： 5 是一个“甜点位” (Sweet Spot)：它既保证了递推式系数之和小于 1（打破了 $O (n \log n)$ 的魔咒），又保持了极低的分组处理常数。

因此，5 是在平衡“排除效率”与“算法常数”后的最优选择。

Master Theorem ​

证明思路 / 推导过程 ​

应用实例：寻找第 k 小的数 (QuickSelect) ​

1. 最坏情况 (Worst Case) ​

2. 平均情况 (Average Case) ​

3. 如何选择一个好的 Pivot？ (Median of Medians) ​

启发式方法：中位数的中位数 (BFPTR 算法) ​

Pivot 的质量保证 ​

复杂度证明 ​

4. 深入讨论：为什么选择 5 作为分组大小？ ​

(1) 为什么选择奇数？ ​

(2) 为什么是 5 而不是 3？ ​

(3) 为什么是 5 而不是 7 或更大？ ​