霍夫曼树 - 给出完美树的最高频率

问题描述

假设您有一个由 4 个字符组成的字母表:A、B、C、D。鉴于哈夫曼树是完美的,最频繁出现的字符的最高可能频率是多少。

我们有一个理论认为它是总长度的 2/5,但我们希望看到更具体的证明或解释。

解决方法

不失一般性,我们假设 p(A)

为了确保我们将 C 和 D 组合成一个分支,p(C) 和 p(D) 必须都小于 p(A) + p(B)。所以p(D) 。请注意,如果 p(C) = p(D) = p(A) + p(B),则 Huffman 算法可以选择在下一步中选择任何对,其中两种情况会导致偏斜树。所以 p(D) 必须严格小于 p(A) + p(B)。

剩下的留给读者作为练习。

(您的猜测很接近。它必须小于 2/5。所以 2/5–ϵ,其中 ϵ 是允许从频率计算概率的最小数字,大概是一个整数,小于 2/5。达到最大值的一组示例概率是 {1/5,1/5,1/5+ϵ,2/5–ϵ}。)