[算法设计与分析入门]贪心算法之哈夫曼编码问题

最新推荐文章于 2024-05-17 13:49:21 发布

原创最新推荐文章于 2024-05-17 13:49:21 发布 · 3k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#算法

算法设计与分析入门专栏收录该内容

3 篇文章

订阅专栏

本文介绍了哈夫曼编码的概念，包括二进制编码、固定长编码、可变长编码和前缀编码，并重点讲解了哈夫曼树的构造过程。通过选取频率最低的结点组合来构建树，确保编码的效率。文章还探讨了贪心算法在哈夫曼编码中的应用，提出了算法的优化子结构和贪心选择性。最后，概述了构建堆和堆操作的算法分析，总时间复杂度为O(nlogn)。

问题概述

1 二进制编码:用二进制字符0-1串来表示
2 固定长编码:每个0-1串的长度是固定的
3 可变长编码:常用短,不常用长
4 前缀编码:没有任何字符的编码是其他字符的前缀

这里需要使用树型结构.
使用字符出现的频率和字符来作为结点的内容[字符:频率]

这里给出一个例子:
[a:45],[b:13],[c,12],[d:16],[e:9],[f:5]

我们引入树T的代价
设 $d_T(c)$ 是符号c在树T的深度,即c的编码长度
$f (c)$ 是符号c出现的频率,在结点中保存
则T的代价是编码一个文件的所有字符的代码位数
$B(T)=∑cf(c)∗dT(c)B(T)=\sum_cf(c)*d_T(c)$

[贪心思想]
我们循环地选择两个具有最低频率的两个结点将它们生成一棵子树,将这两个结点的频率和作为新的父节点的频率值.这样不断进行,直到得到一棵完整的树.

我们需要证明两点

待补充

优化前缀树具有优化子结构
优化前缀树具有贪心选择性

[贪心算法伪代码]

//C是字母表,x.y是C中具有最小频率的两个字符.
Huffman(C,F)
	//字符的个数|C|
	n<-|C|;
	//将C建立成堆
	Q<-C;
	For i<-1 To n-1 Do
	//创建结点存储Z
	z<-Allocate-Node();
	//堆操作
	//堆的左边指向x
	x<-left[z]<-Extract-Min(Q);
	//堆的右边指向y
	y<-right[z]<-Extract-Min(Q);
	//父节点的频率等于两个子节点的频率和
	f(z)<-f(x)+f(y)
	//堆操作
	Insert(Q,z);
Return