计算机10.doc_第1页
计算机10.doc_第2页
计算机10.doc_第3页
计算机10.doc_第4页
计算机10.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北科技学院 用哈夫曼编码实现文件压缩实验报告用哈夫曼编码实现文件压缩实 验 报 告数据结构实验教学改革课题组2006年12月用哈夫曼编码实现文件压缩实验报告班级: 计算机B05-1 学号:20050701 姓名: 指导教师: 实验日期: 成绩: 一、实验题目:用哈夫曼编码实现文件压缩二、实验目的:1、 了解文件的概念。2、 掌握线性链表的插入、删除等算法。3、掌握Huffman树的概念及构造方法。4、掌握二叉树的存储结构及遍历算法。5、利用Huffman树及Huffman编码,掌握实现文件压缩的一般原理。三、实验设备与环境:微型计算机、Windows 系列操作系统 、Visual C+6.0软件四、实验内容:根据ascii码文件中各ascii字符出现的频率情况创建Haffman树,再将各字符对应的哈夫曼编码写入文件中,实现文件压缩。五、概要设计:(1)构造Hufffman树的方法Hufffman算法构造Huffman树步骤:I. 根据给定的n个权值w1,w2,wn,构造n棵只有根结点的二叉树,令起权值为wj。II. 在森林中选取两棵根结点权值最小的树作左右子树,构造一棵新的二叉树,置新二叉树根结点权值为其左右子树根结点权值之和。III. 在森林中删除这两棵树,同时将新得到的二叉树加入森林中。IV. 重复上述两步,直到只含一棵树为止,这棵树即哈夫曼树。(2)Huffman编码:数据通信用的二进制编码思想:根据字符出现频率编码,使电文总长最短编码:根据字符出现频率构造Huffman树,然后将树中结点引向其左孩子的分支标“0”,引向其右孩子的分支标“1”;每个字符的编码即为从根到每个叶子的路径上得到的0、1序列。(3)二叉树的存储结构 typedef struct node datatype data; struct node *lchild, *rchild;BinTree;六、详细设计:(1)Haffman树的存储结构及创建算法:a) 这里的Haffman树采用的是基于数组的带左右儿子结点及父结点下标作为存储结点的二叉树形式,这种空间上的消耗带来了算法实现上的便捷。b) 由于对于最后生成的Haffman树,其所有叶子结点均为从一个内部树扩充出去的,所以,当外部叶子结点数为m个时,内部结点数为m-1,整个Haffman树的需要的结点数为2m-1。存储结构如下:struct HtNode EBTreeType ww; char info; int parentIndex; int llinkIndex; int rlinkIndex; ; struct HtTree struct HtNode htMAXNODE; int rootIndex; ;构造Haffman树流程图如下:开始创建一个新的哈夫曼树创建二叉树为其分配空间对变量赋初值在前面m+i个结点中找两个最小权且无父结点的结点构造一个新的结点i=i+1im-1返回树YesNo(2)将需压缩文件中的每个ascii码对应的haffman编码按bit单位输出,这是本压缩程序中最关键的部分。这里涉及“转换”和“输出”两个关键步骤:“转换”部分大可不必去通过遍历Haffman树来找到每个字符对应的哈夫曼编码,可以将每个Haffman码值及其对应的ascii码存放于结构体中:codeList的创建算法,采用先序遍历的方式进行创建,并且利用递归调用。流程图如YouBiao1,sDepth+;结点指向其左结点文件的压缩编码成功判断当前结点是否有父结点判断当前结点是否有右孩子结点判断当前结点是否有左孩子结点判断是否有孩子结点开始NYYNYNYyouBiao1丨0x01,sDepth+;结点指向其右结点NyouBiao,sDepth与结点返回其父结点N当前结点的左右孩子是否都已访问Y输出”部分是最重要的部分,也是最易出错的部分。这里,涉及到C语言的位操作,要求这个算法能处理好以下几个问题:a)每个字符所对应的haffCode的比特位长度由523位不等长,不可少输,多输,输错任何一位,后一个字符的haffCode要紧跟在前一个字符的haffCode后面。b)最后一个字符要能合理的结束。这主要是为解压缩考虑的,比如,在最后一个要输出的haffCode的最后一位,它恰好是位于最后一个有效字符的第一位,剩下的七个比特位是要用无效的haffCode加以填充的。否则,如果填充的haffCode亦为某个ascii字符的haffCode时,那么在解压缩时,则该在原被压缩文件中不存在的字符便会无中生有的在解压后的文件中出现,这显然是不正确的,应在程序中加以处理。 编码部分的流程下图所示:count=0当文件不为空时Yes当前的一个字符对应的haffcode已输出完毕count8NoNo读入被压缩文件的下一个字符,得到其haffcode,设为curCode,如是最后一个字符,则做相应的处理count+将curCode中的当前位赋值给输出字符左起的第count个位置NoYesYes输出字符到压缩文件(3)main()主函数:开始初始化输入了文件路径?提示输入文件路径返回NoYes获得输入文件名,将它作为压缩后的文件名,且将压缩文件类型设为rer文件有没成功打开找不到文件路径No返回Yes文件打开成功成功输出文件?输出文件失败No结束成功信息Yes是否存在key.txt文件没找到Key.txt文件NoYes返回将key.txt保存到wList数组中构造Haffman树输出Haffman编码值和对应的编码长度printf(ntest start.n)编码printf(ntest ends.n)关闭文件及输出文件结束七、测试结果及分析:通过实验更好的掌握了哈夫曼树,并对哈夫曼树有了深一步的了解。本程序将字符出现的频率(即权值)放在key.txt文件中,然后将这些权值读取出来保存到一个数组中,然后再根据此数组构造Huffman树,得出各字符的Huffman编码值,所以如果没有此key.txt文件,压缩就不会成功。压缩过程中,是对ascii码进行一一对应的转换,没有丢失原文件的信息,是无损压缩。 在解压缩压缩后的文件时,文件类型变为*.rer格式,用其他软件都不能打开,必须有key.txt文件,所以本程序除了可以对文件压缩之外还可以用来对*.txt文件进行加密。通过本次实验我更好的掌握了对程序的调试

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论