文件的哈夫曼编码与解码
编码过程中,踩了一些小坑,做下记录:
- 1.全局变量
count
与std:count
矛盾,建议用其他变量名。 - 2.内存泄漏问题 注意空间要开够 指针不可越界
main
函数内开辟的栈空间大小一般为8MB 若要开辟较大的数组 请去main
函数之外 - 3.编译器错误 推荐大家使用教新的较稳定的编译器
- 4.文件操作 打开后记得关闭 否则会占用系统资源
- 5.申请完空间,要记得释放,养成习惯。释放函数不可张冠李戴(留心编译器的
Warning
)。malloc/free
,new/delete
要配对使用。具体原因可参考 这篇文章
编码要求及任务:
准备一个字符文件,要求:
- 统计该文件中各种字符的频率
- 对各字符进行 Huffman编码,显示每个字符的编码
- 以及将该文件翻译成 Huffman编码文件
- 再将 Huffman编码文件翻译成源文件
- 显示每个字符以一个字节进行二进制编码后的编码文件
实现步骤可分为:
- 统计被编码文件中个字符出现的频数,即统计权重
- 根据权重,构造哈夫曼树,进行哈夫曼编码
- 读取文件进行二进制编码
- 读取文件,将每个字符匹配哈夫曼编码,写入新文件,即完成编码
- 读取编码文件,根据哈夫曼编码进行解码,并写入新文件
- 对比二进制编码和哈夫曼编码后的文件字节大小,并计算压缩率
首先,准备一个源文件
这里我准备了一首小诗,写入文件,并将其命名为poem.txt
If I could save time in a bottle
the first thing that I'd like to do
is to save every day until eternity passes away
just to spend them with you
if I could make days last forever
if words could make wishes come true
I'd save every day like a treasure and then
again I would spend them with you
构建哈夫曼节点
// 定义哈夫曼树节点
typedef struct {
int we