活动介绍

用c语言写一个代码,输入一串字符串,根据给定的字符串中字符出现的频率建立相应的哈夫曼树,构造哈夫曼编码表,在此基础上可以对压缩文件进行压缩,同时可以对压缩后的二进制编码文件进行解压

时间: 2024-03-21 22:44:28 浏览: 167
好的,以下是一个基于C语言的实现,实现了输入字符串后建立哈夫曼树,并构造哈夫曼编码表的功能。同时也提供了对压缩文件进行压缩和解压缩的功能。注意,以下代码仅供参考,实际使用时可能需要根据具体场景进行修改和完善。 ```c #include <stdio.h> #include <stdlib.h> #include <string.h> #include <stdbool.h> #include <stdint.h> #define MAX_LEN 256 typedef struct HuffmanNode { char val; int freq; struct HuffmanNode* left; struct HuffmanNode* right; } HuffmanNode; typedef struct CodeTable { char ch; char* code; } CodeTable; CodeTable code_table[MAX_LEN]; int code_table_size = 0; void print_code_table() { printf("Huffman code table:\n"); for (int i = 0; i < code_table_size; i++) { printf("%c: %s\n", code_table[i].ch, code_table[i].code); } } void free_huffman_tree(HuffmanNode* root) { if (root) { free_huffman_tree(root->left); free_huffman_tree(root->right); free(root); } } int cmp_node(const void* a, const void* b) { HuffmanNode* node1 = *(HuffmanNode**)a; HuffmanNode* node2 = *(HuffmanNode**)b; return node1->freq - node2->freq; } void build_huffman_tree(char* s, int n, HuffmanNode** root) { int freq[MAX_LEN] = {0}; for (int i = 0; i < n; i++) { freq[s[i]]++; } HuffmanNode* nodes[MAX_LEN]; int nodes_size = 0; for (int i = 0; i < MAX_LEN; i++) { if (freq[i] > 0) { nodes[nodes_size] = (HuffmanNode*)malloc(sizeof(HuffmanNode)); nodes[nodes_size]->val = i; nodes[nodes_size]->freq = freq[i]; nodes[nodes_size]->left = NULL; nodes[nodes_size]->right = NULL; nodes_size++; } } while (nodes_size > 1) { qsort(nodes, nodes_size, sizeof(HuffmanNode*), cmp_node); HuffmanNode* node1 = nodes[0]; HuffmanNode* node2 = nodes[1]; HuffmanNode* merged_node = (HuffmanNode*)malloc(sizeof(HuffmanNode)); merged_node->val = -1; merged_node->freq = node1->freq + node2->freq; merged_node->left = node1; merged_node->right = node2; nodes[0] = merged_node; nodes_size--; for (int i = 1; i < nodes_size; i++) { nodes[i] = nodes[i + 1]; } } *root = nodes[0]; } void dfs_huffman_tree(HuffmanNode* root, char* code, int len) { if (root->val != -1) { CodeTable ct = {root->val, (char*)malloc((len + 1) * sizeof(char))}; strcpy(ct.code, code); code_table[code_table_size] = ct; code_table_size++; } if (root->left) { code[len] = '0'; dfs_huffman_tree(root->left, code, len + 1); } if (root->right) { code[len] = '1'; dfs_huffman_tree(root->right, code, len + 1); } } void build_huffman_code_table(HuffmanNode* root) { char code[MAX_LEN] = {0}; dfs_huffman_tree(root, code, 0); } int get_bit(uint8_t byte, int i) { return (byte >> (7 - i)) & 1; } void compress_file(char* src_file, char* dst_file) { FILE* fp_src = fopen(src_file, "rb"); if (!fp_src) { printf("Error: cannot open source file!\n"); return; } FILE* fp_dst = fopen(dst_file, "wb"); if (!fp_dst) { printf("Error: cannot open destination file!\n"); fclose(fp_src); return; } // Count frequency int freq[MAX_LEN] = {0}; char ch; while (fread(&ch, sizeof(char), 1, fp_src) == 1) { freq[ch]++; } rewind(fp_src); // Build Huffman tree HuffmanNode* root = NULL; build_huffman_tree(NULL, MAX_LEN, &root); free_huffman_tree(root); build_huffman_tree(NULL, MAX_LEN, &root); // Build Huffman code table code_table_size = 0; build_huffman_code_table(root); // Write Huffman code table to file fwrite(&code_table_size, sizeof(int), 1, fp_dst); for (int i = 0; i < code_table_size; i++) { fwrite(&code_table[i].ch, sizeof(char), 1, fp_dst); int code_len = strlen(code_table[i].code); fwrite(&code_len, sizeof(int), 1, fp_dst); fwrite(code_table[i].code, sizeof(char), code_len, fp_dst); } // Compress data and write to file uint8_t byte = 0; int bit_count = 0; while (fread(&ch, sizeof(char), 1, fp_src) == 1) { char* code = NULL; for (int i = 0; i < code_table_size; i++) { if (code_table[i].ch == ch) { code = code_table[i].code; break; } } int code_len = strlen(code); for (int i = 0; i < code_len; i++) { byte |= (code[i] - '0') << (7 - bit_count); bit_count++; if (bit_count == 8) { fwrite(&byte, sizeof(uint8_t), 1, fp_dst); byte = 0; bit_count = 0; } } } if (bit_count > 0) { fwrite(&byte, sizeof(uint8_t), 1, fp_dst); } fclose(fp_src); fclose(fp_dst); } void decompress_file(char* src_file, char* dst_file) { FILE* fp_src = fopen(src_file, "rb"); if (!fp_src) { printf("Error: cannot open source file!\n"); return; } FILE* fp_dst = fopen(dst_file, "wb"); if (!fp_dst) { printf("Error: cannot open destination file!\n"); fclose(fp_src); return; } // Read Huffman code table from file fread(&code_table_size, sizeof(int), 1, fp_src); for (int i = 0; i < code_table_size; i++) { fread(&code_table[i].ch, sizeof(char), 1, fp_src); int code_len; fread(&code_len, sizeof(int), 1, fp_src); code_table[i].code = (char*)malloc((code_len + 1) * sizeof(char)); fread(code_table[i].code, sizeof(char), code_len, fp_src); code_table[i].code[code_len] = '\0'; } // Build Huffman tree HuffmanNode* root = NULL; build_huffman_tree(NULL, MAX_LEN, &root); free_huffman_tree(root); build_huffman_tree(NULL, MAX_LEN, &root); // Decompress data and write to file HuffmanNode* current = root; uint8_t byte; while (fread(&byte, sizeof(uint8_t), 1, fp_src) == 1) { for (int i = 0; i < 8; i++) { int bit = get_bit(byte, i); if (bit == 0) { current = current->left; } else { current = current->right; } if (current->val != -1) { fwrite(&current->val, sizeof(char), 1, fp_dst); current = root; } } } fclose(fp_src); fclose(fp_dst); } int main() { char s[MAX_LEN]; printf("Please input a string:\n"); fgets(s, MAX_LEN, stdin); int n = strlen(s); if (s[n - 1] == '\n') { s[n - 1] = '\0'; n--; } // Build Huffman tree HuffmanNode* root = NULL; build_huffman_tree(s, n, &root); // Build Huffman code table code_table_size = 0; build_huffman_code_table(root); print_code_table(); // Compress data and write to file compress_file("input.txt", "output.bin"); // Decompress data and write to file decompress_file("output.bin", "output.txt"); free_huffman_tree(root); return 0; } ```
阅读全文

相关推荐

描述 输入一串字符串,根据给定的字符串中字符出现的频率建立相应哈夫曼树,构造哈夫曼编码表,在此基础上可以对待压缩文件进行压缩(即编码),同时可以对压缩后的二进制编码文件进行解压(即译码)。 输入 多组数据,每组数据一行,为一个字符串(只考虑26个小写字母即可)。当输入字符串为“0”时,输入结束。 输出 每组数据输出2n+3行(n为输入串中字符类别的个数)。第一行为统计出来的字符出现频率(只输出存在的字符,格式为:字符:频度),每两组字符之间用一个空格分隔,字符按照ASCII码从小到大的顺序排列。第二行至第2n行为哈夫曼树的存储结构的终态(形如教材139页表5.2(b),一行当中的数据用空格分隔)。第2n+1行为每个字符的哈夫曼编码(只输出存在的字符,格式为:字符:编码),每两组字符之间用一个空格分隔,字符按照ASCII码从小到大的顺序排列。第2n+2行为编码后的字符串,第2n+3行为解码后的字符串(与输入的字符串相同)。 样例输入1 aaaaaaabbbbbccdddd aabccc 0 样例输出1 a:7 b:5 c:2 d:4 1 7 7 0 0 2 5 6 0 0 3 2 5 0 0 4 4 5 0 0 5 6 6 3 4 6 11 7 2 5 7 18 0 1 6 a:0 b:10 c:110 d:111 00000001010101010110110111111111111 aaaaaaabbbbbccdddd a:2 b:1 c:3 1 2 4 0 0 2 1 4 0 0 3 3 5 0 0 4 3 5 2 1 5 6 0 3 4 a:11 b:10 c:0 111110000 aabccc使用c语言写出完整的代码并加上注释,分析时间复杂度和空间复杂读

最新推荐

recommend-type

C语言中压缩字符串的简单算法小结

在C语言中,字符串压缩是一种将字符串转换为更紧凑形式的技术,常用于节省存储空间或提高数据处理效率。本文将重点介绍三种简单的字符串压缩算法,包括哈夫曼编码,以及它们在不同场景中的应用。 首先,最基础的...
recommend-type

2022年网站美工个人年度工作总结(1).doc

2022年网站美工个人年度工作总结(1).doc
recommend-type

财务软件销售实习报告格式范文-实习报告格式(1).doc

财务软件销售实习报告格式范文-实习报告格式(1).doc
recommend-type

【航迹关联】基于标准 Hough 变换、修正 Hough 变换和序列 Hough 变换实现航迹起始算法研究Matlab代码.rar

【航迹关联】基于标准 Hough 变换、修正 Hough 变换和序列 Hough 变换实现航迹起始算法研究Matlab代码
recommend-type

获取本机IP地址的程序源码分析

从给定文件信息中我们可以提取出的关键知识点是“取本机IP”的实现方法以及与之相关的编程技术和源代码。在当今的信息技术领域中,获取本机IP地址是一项基本技能,广泛应用于网络通信类的软件开发中,下面将详细介绍这一知识点。 首先,获取本机IP地址通常需要依赖于编程语言和操作系统的API。不同的操作系统提供了不同的方法来获取IP地址。在Windows操作系统中,可以通过调用Windows API中的GetAdaptersInfo()或GetAdaptersAddresses()函数来获取网络适配器信息,进而得到IP地址。在类Unix操作系统中,可以通过读取/proc/net或是使用系统命令ifconfig、ip等来获取网络接口信息。 在程序设计过程中,获取本机IP地址的源程序通常会用到网络编程的知识,比如套接字编程(Socket Programming)。网络编程允许程序之间进行通信,套接字则是在网络通信过程中用于发送和接收数据的接口。在许多高级语言中,如Python、Java、C#等,都提供了内置的网络库和类来简化网络编程的工作。 在网络通信类中,IP地址是区分不同网络节点的重要标识,它是由IP协议规定的,用于在网络中唯一标识一个网络接口。IP地址可以是IPv4,也可以是较新的IPv6。IPv4地址由32位二进制数表示,通常分为四部分,每部分由8位构成,并以点分隔,如192.168.1.1。IPv6地址则由128位二进制数表示,其表示方法与IPv4有所不同,以冒号分隔的8组16进制数表示,如2001:0db8:85a3:0000:0000:8a2e:0370:7334。 当编写源代码以获取本机IP地址时,通常涉及到以下几个步骤: 1. 选择合适的编程语言和相关库。 2. 根据目标操作系统的API或系统命令获取网络接口信息。 3. 分析网络接口信息,提取出IP地址。 4. 将提取的IP地址转换成适合程序内部使用的格式。 5. 在程序中提供相应功能,如显示IP地址或用于网络通信。 例如,在Python中,可以使用内置的socket库来获取本机IP地址。一个简单的示例代码如下: ```python import socket # 获取主机名 hostname = socket.gethostname() # 获取本机IP local_ip = socket.gethostbyname(hostname) print("本机IP地址是:", local_ip) ``` 在实际应用中,获取本机IP地址通常是为了实现网络通信功能,例如建立客户端与服务器的连接,或者是在开发涉及到IP地址的其他功能时使用。 关于文件名称“getIP”,这是一个自解释的文件名,明显表示该文件或程序的作用是获取本机的IP地址。从标签“控件 源码 网络通信类 资源”中我们可以看出,这个文件很可能是一个可以嵌入其他软件中的代码片段,用以实现网络通信功能的一部分,具有较高的灵活性和重用性。 综上所述,获取本机IP地址是一个涉及到操作系统API、网络编程以及特定编程语言知识的技能。它不仅需要对编程语言提供的库函数有深入的理解,还要对操作系统的网络配置和IP协议有足够的认识。通过阅读和分析相关的源代码,如“getIP”,可以加深对网络编程实现细节的理解,并能够在实际开发中快速地应用这一技术。
recommend-type

【权威指南】:Win11笔记本上RTX4080驱动的安装与调试秘籍

# 1. Win11笔记本与RTX4080显卡介绍 随着技术的不断发展,笔记本电脑已不再是仅仅满足办公需求的移动设备,而是逐渐成为可以胜任复杂图形处理和游戏任务的强大工具。微软推出的Windows 11操作系统,以其全新的用户界面和改进的系统性能,为用户提供了更为流畅的操作体验。而在硬件方面,NVIDIA的RTX 4080显卡以其卓越的图形处理能力和AI支持,为笔记本电脑带来了前所未有的性能提升。本章节将带您初步了解Windows 11笔记本与NVIDIA RTX 4080显卡的基础信息,为进一步深入探讨它们的优化和调试技巧奠定基础。 ## 1.1 Win11笔记本的优势 Windows
recommend-type

windows环境举例

<think>好的,用户现在想在Windows环境下创建C函数库,需要具体的方法和示例代码。我需要结合之前的回答和用户提供的引用内容来给出合适的指导。 首先回顾之前的回答,用户已经了解了在Linux下创建静态库和动态库的方法,现在需要切换到Windows环境。根据引用[2],Windows下的C标准库和动态链接库的处理与Linux不同,比如使用dlfcn.h在Linux,而Windows可能需要其他方式。另外,引用[1]提到了在Windows下配置gcc环境(MinGW-w64),这可能是一个关键点,因为用户可能需要使用MinGW来编译库。 用户提供的引用[3]提到了使用MSVC编译器,这
recommend-type

QQ自动发送/回复系统源代码开放

根据提供的文件信息,我们可以了解到以下几点关键的知识点: ### 标题:“qqhelp” 1. **项目类型**: 标题“qqhelp”暗示这是一个与QQ相关的帮助工具或项目。QQ是中国流行的即时通讯软件,因此这个标题表明项目可能提供了对QQ客户端功能的辅助或扩展。 2. **用途**: “help”表明此项目的主要目的是提供帮助或解决问题。由于它提到了QQ,并且涉及“autosend/reply”功能,我们可以推测该项目可能用于自动化发送消息回复,或提供某种形式的自动回复机制。 ### 描述:“I put it to my web, but nobody sendmessage to got the source, now I public it. it supply qq,ticq autosend/reply ,full sourcecode use it as you like” 1. **发布情况**: 描述提到该项目原先被放置在某人的网站上,并且没有收到请求源代码的消息。这可能意味着项目不够知名或者需求不高。现在作者决定公开发布,这可能是因为希望项目能够被更多人了解和使用,或是出于开源共享的精神。 2. **功能特性**: 提到的“autosend/reply”表明该项目能够实现自动发送和回复消息。这种功能对于需要进行批量或定时消息沟通的应用场景非常有用,例如客户服务、自动化的营销通知等。 3. **代码可用性**: 作者指出提供了“full sourcecode”,意味着源代码完全开放,用户可以自由使用,无论是查看、学习还是修改,用户都有很大的灵活性。这对于希望学习编程或者有特定需求的开发者来说是一个很大的优势。 ### 标签:“综合系统类” 1. **项目分类**: 标签“综合系统类”表明这个项目可能是一个多功能的集成系统,它可能不仅限于QQ相关的功能,还可能包含了其他类型的综合服务或特性。 2. **技术范畴**: 这个标签可能表明该项目的技术实现比较全面,可能涉及到了多个技术栈或者系统集成的知识点,例如消息处理、网络编程、自动化处理等。 ### 压缩包子文件的文件名称列表: 1. **Unit1.dfm**: 这是一个Delphi或Object Pascal语言的窗体定义文件,用于定义应用程序中的用户界面布局。DFM文件通常用于存储组件的属性和位置信息,使得开发者可以快速地进行用户界面的设计和调整。 2. **qqhelp.dpr**: DPR是Delphi项目文件的扩展名,包含了Delphi项目的核心设置,如程序入口、使用的单元(Units)等。这个文件是编译和构建Delphi项目的起点,它能够帮助开发者了解项目的组织结构和编译指令。 3. **Unit1.pas**: PAS是Delphi或Object Pascal语言的源代码文件。这个文件可能包含了与QQ帮助工具相关的核心逻辑代码,例如处理自动发送和回复消息的算法等。 4. **readme.txt**: 这是一个常见的文本文件,包含项目的基本说明和使用指导,帮助用户了解如何获取、安装、运行和定制该项目。README文件通常是用户与项目首次交互时首先阅读的文件,因此它对于一个开源项目的用户友好度有着重要影响。 通过以上分析,我们可以看出“qqhelp”项目是一个针对QQ通讯工具的自动化消息发送与回复的辅助工具。项目包含完整的源代码,用户可以根据自己的需要进行查看、修改和使用。它可能包含Delphi语言编写的窗体界面和后端逻辑代码,具有一定的综合系统特性。项目作者出于某种原因将其开源,希望能够得到更广泛的使用和反馈。
recommend-type

【7步打造Win11深度学习利器】:Tensorflow-GPU与RTX4080终极优化指南

# 1. 深度学习与Windows 11的融合 在人工智能时代,深度学习已渗透到生活的方方面面,而Windows 11作为最新一代的操作系统,为深度学习提供了一个高效的工作平台。本章节将探讨深度学习技术如何与Windows 11系统融合,以及这一
recommend-type

ue画笔画画蓝图版

<think>我们正在讨论的是在UnrealEngine中使用蓝图实现画笔绘画功能。根据用户需求,重点在于通过蓝图系统实现类似毛笔的绘画效果。结合之前的回答和引用内容,我们将详细展开实现方法。核心思路:通过捕捉输入轨迹,动态生成笔触网格,并应用材质模拟墨迹效果。###详细实现步骤####1.创建绘画蓝图创建一个名为`BP_PaintBrush`的Actor蓝图:-**根组件**:SceneComponent-**关键组件**:-`SplineComponent`:用于存储绘画路径点-`InstancedStaticMeshComponent`:高效渲染重复笔触段(替代单个SplineMesh组