第5章图像编码 (2).ppt_第1页
第5章图像编码 (2).ppt_第2页
第5章图像编码 (2).ppt_第3页
第5章图像编码 (2).ppt_第4页
第5章图像编码 (2).ppt_第5页
已阅读5页,还剩113页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第5章 图像编码,5.1 图像信息的冗余 5.1.1 图像数据压缩的必要性与可能性 1. 图像压缩与编码: 对图像数据按一定的规则进行变换和组合,从而达到以尽可能少的代码( 符号)来表示尽可能多的信息。 主要研究内容:,数据的表示、传输、变换和编码方法,目的是减 少存储数据所需要的空间和传输所用的时间。,2.数字图像的信息冗余: 图像数据本身存在冗余性和相关性, 一般图像中存在很大的冗余度。因此图像信息的 压缩是可能的。 冗余:从信息论观点看,描述图像信源的数据由有用数据和冗余数据两部分组成。信息中存在的多 余的数据即为冗余。 图像数据冗余主要表现为: 空间冗余、时间冗余、信息熵冗余(编码冗余

2、) 、结构冗余、知识冗余、频谱冗余(视觉冗余 )及其它冗余。,视觉冗余:人的眼睛对图像细节和颜色的辨认有一个 极限,人的视觉特性决定了它最多可辨认出216 种颜色,而彩色图像一般每个像素用24位表 示,则可表示出224种颜色,由此而带来的数 据冗余即为视觉冗余。,(a)图是256个灰度级图像 (b)图是16个灰度级图像 (c)图是16个灰度级图像,(a)图是灰度图像 (b)图是二值图像,空间冗余:当图像中的大部分景物表面颜色都是均匀 的、连续的,图像数字化后大量相邻像素的数 据是完全一样或十分接近的,这就是空间冗余。,知识冗余:在图像的理解与图像表达的数据量之间 产生的冗余。,时间冗余:在运动

3、图像中,相邻两帧图像之间有较大 的相关性。,结构冗余:由图像存在的纹理或图元(分块子图像) 的相似结构上产生的冗余。,7.1.2 图像编码压缩的分类 根据解压重建后的图像与原始图像之间是否具有误 差,图像编码压缩分为无损压缩编码和有损压缩编码。,信息熵冗余:由编码方式而产生的冗余。,编码冗余说明表: code1中Lavg=2,code2中Lavg=1.81,典型的无损压缩有Huffman(郝夫曼编码)、Fano-Shannon(香农-范诺)编码、算术编码和游程编码等。,适用于要求重建后图像严格 的和原始图像保持一致的场合(如复制、保存十分珍贵的历史、文物图像)。,无损压缩编码(可逆编码): 算

4、法中删除的仅仅是图像数据中冗余的信息,因此 解压缩时能精确恢复原图像,即压缩是完全可以恢复的和没有偏差的,信息没有损失。,典型的有损压缩有预测编码、变换域编码等。,有损编码(不可逆编码) 算法把不相干的信息删除,允许重构数据与原始数据存在一定误差,因此只能对原始图像 进行近似的重建,不能精确地复原,但视觉或听觉效果一般是可被接受的,或能够满足用户要求。适合大多数用于存储数字化了的模拟图像。,5.1.3 图像压缩的性能评价 1. 数据压缩技术的重要指标: (1) 压缩比:图像原始数据所需的比特数与压缩编码后所需的比特数之比。压缩比越大越好。 (2) 失真性:复原后图像与原始图像之间的差别。 (3

5、) 压缩算法:利用不同的编码方法,实现对图像的 数据压缩。,压缩算法与压缩比关系: 无损压缩能保证完全恢复原始图像,但压缩比较小;有损压缩时原始数据不能完全恢复,但压缩比较高。,2.图像保真度准则: 描述解码图像相对原始图像偏离程度的测度称为保真度(逼真度)准则。 常用的准则可分为: 客观保真度准则和主观保真度准则。,客观保真度准则: 最常用的客观保真度准则是原图像和解码图像之 间的均方误差和均方信噪比两种。 均方误差:,压缩比、均方误差及信噪比的关系:,在相同的压缩比下,均方误差越小,性能越好。反 之,在相同的均方误差下,压缩比越大,性能越好。 在相同的压缩比下,信噪比越大,性能越好。反之,

6、在相同的信噪比下,压缩比越大,性能越好。,基本信噪比:用分贝表示压缩图像的定量评价。,峰值信噪比:,主观保真度准则: 客观保真度是一种统计平均意义下的度量准则, 对于图像的细节无法反映出来。具有相同客观保真度 的不同图像,人的视觉可能产生不同的视觉效果。 因 此采用主观方法测量图的质量更合适。,方 法:常用的方法是对一组( 不少于20 人)观察者显示图 像,并将它们对该图像的评分取平均,来评价一幅图 像的主观质量。,另一种方法是对照某种绝对尺度进行,即根据图像的绝对质量进行打分。 例如,有关电视图像的绝对评价打分标准如下表: 图像质量的主观评分表,主观评价可用平均感觉分来表示:,5.2 信息理

7、论技术与熵编码 设离散信息源X=x1,x2,xN,每个符号出现的概率是确定的,为pk=p(xk),自信息量:一个概率小的符号出现将带来更大的信息 量,即信息量与该符号的概率倒数成正比。,信息熵:构成的离散信源的每个符号的平均信息量。,例:7.1,7.2,7.3,图像平均码长:,5.2.1 离散信源的熵表示,结论: 1)信源的平均码长大于等于熵,即熵是无失真编码的下界。 2)如果所有的自信息I(xk)都是整数,且与各符号码长相等,可以使平均码长等于熵。 3)对非等概率分布的信源,采用不等长编码,其平均码长小于等长编码的平均码长。 4)如果信源中各符号出现的概率相等,则信源熵H(X)的值达到最大。

8、最大离散熵定理。,5.2.2 离散信源编码定理 1.香农信息保持定理 香农信息论已证明,信息熵是无失真编码的理论极限。低于此极限的无失真编码是不存在的。 2.变长编码定理 若一个离散无记忆信源X具有熵H(X),并有r个码元符号集,则总可以找到一种无失真信源编码,构成单义可译码,使其平均码长满足:,3.变长最佳编码定理 对出现概率大的信息符号赋予短字码,对于出现概率小的信息符号赋予长字码。变长编码的平均码长一定小于任何其他排列形式。,5.3 熵编码技术 1.编码技术 编码技术研究的是如何在满足一定的图像保真 条件下,压缩表示原始图像数据的编码方法。,编码技术的分类: 根据解码后的数据与原始图像数

9、据是否完全一致,可 分为有损编码和无损编码; 根据压缩原理 ,可分为信息熵编码、预测编码和变换编码等。,图像格式标准: 采用不同的编码得到不同的格式,目前流行的格式有:BMP 、PCX 、TIF、JPEG 等。,2.图像冗余度和编码效率 编码效率和冗余度是用来衡量编码方法优劣的准则。,原始图像平均码长:,由信息论可知,熵H(X)是离散无记忆信源 进行无失真编码时的基本极限,即找不到平均 码长比其更短的无失真编码,即:,编码效率定义:,经过编码压缩后,图像信息的冗余度接近于零,或编码效率已接近于1,这是压缩已接近其下限,成为高效编码。可以用上述准则来衡量编码方法的优劣。,3.统计编码方法: 统计

10、编码:根据数据出现概率的分布特性而进行的压缩编码。常用的统计编码有变长编码,包括郝夫曼编码、香农-范诺编码和算术编码等。,变长编码: 对图像的灰度级用自然码编码,一般总会产生编码冗余,为消除这种冗余常采用变长编码。 方法:如果用较少的比特数表示出现概率较大的灰度 级,而用较多的比特数表示出现概率较小的灰 度级,这种压缩方法称为变长编码。,例:1幅8灰度级图像分别用自然码和变长码表示, 并计算它们的平均码长。,结果:用3bit自然码进行编码时,平均码长为3。 采用变长编码时的平均码长为2.7。,例:设一离散信源X为,可见变长编码可以达到较高的编码效率。,郝夫曼(Huffman)编码: 原理: 郝

11、夫曼编码是运用信息熵原理的一种无损编 码。压缩方法是利用变长编码将图像中出现概 率大的灰度值赋予短码字;而对出现概率小的 灰度值赋予长码字,从而达到压缩数据的目的。 编码方法: (1)将图像灰度值按概率由大到小排列; (2)把两个最小的概率加起来作为新符号的概率; (3)重复步骤(1)、(2),直到概率和达到1为止;,(4)在每次合并符号时,将被合并的符号赋以1和0 (大概率赋1,小概率赋0,或相反); (5)寻找从每一信号源符号到概率为1处的路径,记录 下路径上的1和0; (6)对每一符号写出“1”、“0”序列,序列的顺序是从 树根到信号源符号节点。,例:用郝夫曼编码进行二元编码,元素 ai

12、 a1 a2 a3 a4 a5 a6 概率P(ai) 0.1 0.4 0.06 0.1 0.04 0.3 编码 011 1 01010 0100 01011 00,郝夫曼编码的特点: (1)哈夫曼编码构造出来的编码值不是唯一的; (2)编码效率与信源符号概率分布相关。当图像灰度值分布很不均匀时,哈夫曼编码的效率就高;而图像灰度值的概率分布比较均匀时,哈夫曼编码的效率就很低。,Lavg,(3)郝夫曼编码由于码字不等长,实时硬件实现复杂,且抗误码能力较差。 (4)由于只能用近似整数而不是理想的小数表示单个符号,因此无法达到最理想的压缩效果。,香农-范诺(Shannon-Fano)编码 香农-范诺分

13、别单独提出类似方法,使编码更简单。 方法: (1)把信源中的消息x1xn按概率从大到小、从上到下排成一列,然后把x1xn分成两组x1xk,xk+1xn,并使得它们的概率和尽可能接近,即,(2)赋值原则:把两组的xi 赋0和1,设概率大的一组赋为0,概率小的一组赋为1(或相反)。 (3)把两组分别按(1)、(2)不断重复分组、赋值,直到每组只有一种输出为止。将每个xi所赋的值依次排列起来就是香侬范诺编码。 例:,练习题: 设某一幅图像共有8个灰度级,各灰度级出现的概率分别为:P1=0.20,P2=0.09,P3=0.11,P4=0.13,P5=0.07,P6=0.12,P7=0.08,P8=0.

14、20。试对此图像进行郝夫曼编码和香侬范诺编码,并计算信源的熵、平均码长、编码效率及冗余度。,算术编码: 基本原理:把整个信源表示为实数线上的0到1之间的一个区间,其长度等于该序列的概率。再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。采用算术编码不再是将单个信源符号映射成一个码字,每个符号的平均编码长度可以为小数。 编码步骤: 1)根据符号概率,沿着“概率线”为每个符号设定一个范围。设概率范围用rang表示,low表示新范围低端,high表示新范围高端;rang_low,rang_high分别表示某信源符号给定范围的低、高端。,2)初始化,其概率范围: rang=1.0,lo

15、w=0。 3)对每一个信源符号依次计算新的概率范围: low=low+rangrang_low high=low+rangrang_high 4)从最后得到的区间中选择一个数作为编码输出。,例:设信源符号为X=00,01,10,11,其中各符号的概率为P(X)=0.1,0.4,0.2,0.3。假如输入的消息序列为:10、00、11、00、10、11、01。试将其进行算术编码。,解: 1)沿“概率线”为每个符号设定概率范围: 0,0.1),0.1,0.5),0.5,0.7),0.7,1.0 2)初始化:范围range为1.0,低端值low为0;,0,0,1,1,6,7,解码:编码的逆过程。 根据

16、编码时的概率分配表和压缩后数据代码所在的范围,确定代码所对应的每一个数据符号。,同样再减去信源符号00的下界0,除以信源符号00的范围0.1,得到0.71938,已知0.71938落在信源符号11区间,所以得到第三个信源符号为11.已知0.1落在信源符号01的区间。再减去信源符号01的下界得到0,解码结束。解码操作过程综合如下:,算术编码的主要特点: 优点: 不必预先定义信源出现的概率模型,而是根据各个信源出现的概率自适应地调节码长。 不足: 1)由于实际的计算机的精度不可能无限长,运算中会出现溢出问题。 2)算术编码器对整个消息只产生一个码字,这个码字是在0,1)之间的一个实数,因此译码器必

17、须在接收到这个实数后才能译码。 3)算术编码也是一种对错误很敏感的方法。,练习题:书p189-7.8,行程编码(RLE):利用空间冗余度压缩图像。 原理:在给定的图像数据中寻找连续重复的数值,然后用两个字符值取代这些连续值。 例:一串用字母表示的数据为: “aaabbbbccccdddeeddaa”,经过行程编码处理可表示为“3a4b4c3d2e2d2a”。,图像编码方法:,例:该图像有8个灰度级,24个像素。,编码1: 灰度值用3位码,总比特数=243=72bit 行程编码: 灰度值用3位码,行程长度用4位码,则每对参数有7位码,共4对,总比特数=74=28bit,不同格式的图像文件采用行程

18、编码压缩数据图像时,编码方法略有不同。,BMP的RLE4压缩算法: 与一般的行程编码不同的是在第1字节中所表示的连续数据的个数是像素个数而不是字节个数。 另外它是针对16色图像数据的处理,引进了特殊的识别码。,例:数据0X08 0X57 RLE编码:表示将图像数据0X57连续重复显示8个 字节; RLE4压缩算法:表示连续显示8个像素。,PCX的RLE压缩算法: 只要在图像数据中发现一串连续相同的值,就用两个字节代替这串连续相同的值,存入图像文件中。这两个字节中的第一字节代表这串相同数据的个数,第二字节代表这串数据的值。对于不重复的数据则单独处理。,LZW(Lempel-Ziv-Welch)编

19、码 LZW编码不需要了解信源的概率,对信源符号的可变长度序列分配固定长度的码字。它能消除或减少图像中的像素间冗余,是一种信息保存型的编码方式。该编码方法是UNIX操作系统中的标准文件压缩方法。,方法: 它是一种字典方法,在编码的开始阶段要构造一个对信号源符号进行编码的编码表(字典),将输入字符串映射成定长的码字输出。算法在产生输出字符串的同时更新编码表。,LZW算法执行步骤: 1)将字典初始化,使其包含所有可能的单字符。初始化前缀P为空。 2)当前字符C的内容为输入字符流中的下一个字符。 3)判断P+C是否在字典中:若“是”,则用C扩展P,即令P=P+C。若“否”,则:输出当前前缀P的码字到码

20、字流;将P+C添加到字典中;令前缀P=C。 4)判断输入字符流中是否还有码字要编码:若“是”返回到步骤2);若“否”则把当前前缀P的码字输出到码字流,并结束。,字典的尺寸(编码器参数)是重要参数。如对于8比特灰度图像,一个9比特(512个字)的字典中,前256个码字被分配给灰度值0,1,255,则位置256512将用来存放新的字符串。,例:对一个有三字符A,B,C组成的字符串 “ABBABABAC”进行LZW编码。 1)初始化编码表,将A,B,C单字符串存入表中,并 分别赋予码字值1,2,3。设前缀P并初始化为空;字符C为当前输入的字符。,2)将输入的字符串从左至右逐个输入到编码器。 输入第1

21、个字符A,即C=A,则P+C=A已在表中,所 以P=P+A=A。 输入第2个字符B,即C=B,字符串P+C=AB。由于串 表中没有字符串AB,则:,由于B是字符串AB的扩展字符,A是其前缀,将前缀A的码字值1输出;将AB加入串表中,并依次赋予AB串的码字值为4;令P=B。,最后将前缀C的码字值3输出,形成如表所示的串表和LZW编码输出。,解码:由字符串表根据编码字串 逐一翻译即可。 输出码字值串:1 2 2 4 7 3,LZW编码特点: 1)在编码的同时建立了一个码本; 2)是一种自适应的压缩方法,但它对输入数据的适应比较慢,因为每次字典中的条目只增加一个,且这个条目只比原条目增加一个字符。,

22、解码后的字串:A B B AB ABA C,5.4预测编码 预测:根据过去时刻的样本序列,运用一种模型,预 测当前的样本值。 预测编码:通常不直接对信号编码,而是对预测误差 编码。当预测比较准确,误差比较小时,即可达 到编码压缩的目的,它能减少数据在时间和空 间 上的相关性。,预测编码可分为无损预测编码和有损预测编码。,原理: 预测编码是一种简单、有效的编码方法,其基本原理是利用线性预测技术去除空间上较为接近的像素间的冗余,对预测值与实际值之间的差值(即预测误差)进行量化编码。由于预测误差的方差远远小于输入序列的方差,从而提高编码效率,实现图像压缩。,1.无损预测编码 通过对每个像素实际值与预

23、测值之间的差异,进行提取和编码,来消除空间上较为接近的像素之间的冗余。,原理:,同时,熵是概率分布的函数,分布越均匀,熵越大,其平均码长的下限越大,从而表示每个消息所需的比特数(码率)就会增高;反之,分布越集中其熵越小,平均码长的下限越小,从而码率就会降低。,理论简析:,预测误差的方差比原始图像信号的方差小,其概率分布比原始图像信号更集中,因此,预测误差的熵比原始图像信号的熵要小。 根据上述原理,预测编码不直接对原始数据进行量化与编码,而对预测误差进行量化与编码,从而提高了编码效率。 P160-图7.10,误差预测模型:,1)前值预测: 2)一维预测: 3)二维预测:,常用线性预测方法:,例:

24、差分脉冲编码调制(DPCM)是一种最典型的预 测编码方法。其原理框图如下 :,设系统中,xN为tN时刻的亮度取样值。预测器根据tN时刻之前的样本1,x2,xN-1对xN作预测,得到预测值xN。 xN与xN之间的误差为eN=xN-xN,量化器对eN进行量化得到eN。编码器对eN进行编码发送。接收端解码时的预测过程与发送端相同,所以预测器也相同。接收端恢复的输出信号xN是xN的近似值,两者的误差是:,例:差分脉冲编码调 制(DPCM),线性预测编码: 图像序列xi(i=1,2,N-1)中,根据x1,x2,xN-1对xN作预测。令xN的预测估计值为xN,设xN是x1,x2,xN-1的线性组合,则称对

25、xN的预测为线性预测。 最优线性预测:,在上式,非线性预测编码: 线性预测系数ai是一种近似条件下的常数,忽略了像素的个性,存在不足,影响图像质量。 不足:,则上式可表示成:,(1)对灰度有突变的地方,会有较大的预测误 差,致使图像的边缘模糊,分辨率降低; (2)对灰度变化缓慢区域,其差值信号应为零, 但因其预测值偏大而使重构图像有颗粒噪声。,非线性预测特点: 非线性预测编码充分考虑图像的统计特性和个别变化,尽量使预测系数与图像所处的局部特性相匹配,即预测系数随预测环境而变,因此称为自适应预测编码。,式中,k为自适应系数。一般,取k=1,但对灰度变化大的局部,由于预测偏小,这时可令k=1.12

26、5,以避免局部边缘被平滑;对灰度变化缓慢区域,预测值可能偏大,这时可令k=0.875 ,以消除颗粒噪声的影响。,例: 预测技术的对比 设量化误差为零且采用下列四个预测器之一:,四个预测器的误差图像分别为图a,b,c,d, 看出:随着预测器阶数的增加明显可见误差减小。,例:一种简单的有损预测编码德尔塔调制:,量化器作用:将预测误差映射成有限范围内的输出,表示为,.有损预测编码 在无损预测编码模型中加上一个量化器构成有损预测编码。,3 最佳线性预测器 选择线性预测器中合适的系数,使得误差信号的均方误差最小。 信号的均方误差为:,对上式求导,令导数为零,即可求出使均方差为极小值时的各个线性预测系数,

27、5.5 图像的变换编码 1.变换编码的基本原理 : 通过正交变换(如傅里叶变换、离散余弦变换等),把图像从空间域转换为能量比较集中的变换域(频域),变换后的结果产生一批变换系数,然后对这些变换系数进行编码处理,达到压缩图像的目的。,2.正交变换编码 在正交变换编码中,常用的正交变换有: DFT,DCT,WHT,KLT等。正交变换具有如下优点:,(1)熵保持。正交变换具有熵保持性质,即正交变换不丢失信息,从而通过传输变换系数来传送信息。,(2)能量集中。变换域中的能量多集中于少数变换系 数上,大多数系数的数值都很小。因此对于能量 较小的系数可粗糙量化,分配较小的比 特,或完 全忽略。对于能量较大

28、的系数,分配较多的比特。 从而利用熵编码来压缩数据。,(3)去相关。正交变换能够去除像素间的冗余, 变换系数间的相关性为零或较小。,总之,正交变换能够去除或减小数据间的相关性,减小信源的信息冗余,实现数据压缩,提高信息传输或存储系统的有效性。,正交变换的选择: 在正交变换编码中,需要选择一种合适的正交变换。实际应用中,应综合考虑变换的去相关能力、能量集中能力和计算复杂程度等。一般在性能满足要求的条件下,尽可能选择简单的变换。,常用正交变换性能比较: 常用的正交变换有:DFT,DCT,WHT,KLT等。 从运算量大小和压缩效果这两方面比较,其性能比较如下表:(表中是一维N点各种正交变换所需的运算

29、次数,从上至下的顺序代表了运算量大小和压缩效果)。,变换编码的步骤: (1)确定变换矩阵A和图像的分块 在正交变换编码中,需要把一幅图像分割成若干个大小为nn的子图像,对各个子图像进行变换、量化与编码。常用的子图像大小为88和1616。,结论:从表中可以看出,K-L变换的运算量最大,WHT变换运算量最小,但压缩效果较差。而综合比较,DCT的综合效果较好,因此,在正交变换编码中,DCT是首要选择,并已成功应用于编码标准中,如JPEG,MPEG-1,MPEG-2等。,一维变换相当于把图像分成子块,每一子块为1N的一个N维向量即:,子图像区域的选择: 子图像尺寸大小取44,88,1616适合图像压缩

30、。,图像尺寸过小,计算速度较快,但压缩能力有限;子图像尺寸过大,去相关性效果好,但增加计算的复杂性,若图像的相关性较小,压缩效果不明显。,a) DC分量 b) DC和2个最低AC系数 c) DC和9个最低AC系数 d)全部64个系数的恢复结果,区域编码实例,b),a),c),d),(2)变换域采样: 即对变换域中的系数进行取舍。系数选取越多,重构图像效果越好,但压缩比会下降。,区域编码法: 选出能量集中的区域(正交变换中能量多半集中于低频区域),并对这一区域的系数进行编码传送,而其他区域的系数可以舍弃。在解码端对舍弃的系数进行补零处理。这样由于保持了大部分图像能量,在恢复图像中带来的质量劣化并

31、不显著。,在变换编码中常用的系数选取方法: 区域编码:根据最大方差进行选择; 阈值编码:根据最大值的量级选择。,特点: 在区域编码中,区域抽样和区域编码的均方误差都与方块大小有关。其显著缺点是一旦选定某个区域就固定不变了,有时图像中的能量也会在其他区域集中较大的数值,这时舍弃它们会造成图像质量的较大损失。 阈值编码法: 阈值编码法先设定一个门限值T,当变换系数超过T值时,就保留下来并进行编码传送;当系数值小于T时就舍弃不用。,变换子图像选取阈值常用方法: 1)对所有子图像用一个全局阈值: 压缩效果不稳定,因图像而异,阈值选择有困难。 2)对各子图像分别用不同的阈值: 每幅子图像都丢弃相同数目的

32、系数,其编码率事先可知。 3)根据各子图像中各系数的位置选取阈值 将取阈值和量化结合,码率是变化的,有自适应性。,缺点:由于超过门限值的系数的位置是随机的,因此 在编码中除了对系数值进行编码外,还要有位 置码,这两种码同时传送,才能在接收端收到 正确恢复的图像。所以其压缩比有时会下降。,特点: 优点:有一定的自适应能力,可以得到较区域编码好 的图像质量;,(3)系数量化: 变换后的系数是独立的和有序的,利用量化使数 据得到压缩。 量化是产生有损压缩的原因,为了使量化失真最小, 可采用不同的量化方法(编码)。 (4)解码与反变换: 在接收端对接收到的码流进行解码,分离出各变 换系数,且将舍去的系

33、数代为“0”,然后求反变换, 恢 复各图像子块。,例:利用DCT变换来实现图像的压缩,%返回DCT变换矩阵,4.小波编码: 小波编码器:小波编码是变换编码算法之一,因此同 变换编码器一样,小波编码器由三个部分组成: 变换、量化和熵编码输出。 典型小波编码系统:,小波编码步骤: 1)对原始图像进行小波变换,得到小波系数; 2)对小波系数进行分析量化; 3)编码。,小波编码特点: 小波变换能将原始图像的能量集中到少部分小波系数上,且分解后的小波系数在三个方向的细节分量有较高的局部相关性。因此,小波编码可以得到较高的压缩比,且压缩速度较快。,基于DCT的图像压缩所产生的块状失真 b) 基于Wavel

34、et的图像压缩解码效果,a),b),小波基的选择: 由于小波函数是不唯一的,不同的小波对同一幅图像的压缩效果是有差异的。因此如何选择最优的小波基是首要问题。 小波基的选择一般考虑以下因素: 1)小波基的正则性和消失距; 正则性是函数光滑性的一种描述,也反映了函数频域能量集中的程度。同时,正则性高的小波重构后,图像失真比较平滑,视觉效果较好。,有较大消失矩的小波基用于图像编码,意味着在一个相当平坦的区域附近小波系数接近零,这会提高压缩效率。,2)小波基的线性相位(对称性) 如果正交基不具有对称性,就不能保证线性相位,在图像编码应用中,会引入相位失真。因此,图像编码中一般使用由对称性的小波基。如双

35、正交小波基。,3)所处理图像与小波基的相似性 当小波函数与待压缩图像结构上存在一定的相似性时,也会影响压缩效果。,小波分解等级选择:,4)小波函数的能量集中性 5)综合考虑压缩效率和计算复杂度,小波系数的分析与量化 一幅图像进行小波分解后,得到一系列不同尺度的子图像,不同尺度的子图像对应不同的频率。高频子图像上小波系数的绝对值较小,而低频子图像上小波系数的绝对值较大。因此,在图像编码中,对高频系数分配较小的比特,达到压缩的目的。,小波编码(系数量化设计): 直接阈值编码、基于小波树结构的矢量量化法、嵌入式零树小波编码,5.6图像压缩标准 图像压缩的国际标准主要由国际标准化组织(Internat

36、ional Standardization Organization,简称ISO)和国际电信联盟(International Telecommunication Union,简称ITN)制定的。 由这两个组织制定的国际标准可分成三个部分: 静止(灰度和彩色)图像压缩标准、运动图像压缩标准和二值图像压缩标准。图像编码国际标准极大地促进了全球范围内信息传输的发展。 1.静止图像压缩标准JPEG:,联合专家组建立了静态灰度(或彩色)图像压缩的公开算法,并于1992年开始通过并公布,1994年3月通过为正式标准。它定义三种编码系统: (1)DCT有损编码系统; (2)扩展编码系统; (3)无失真编码系

37、统。 在视觉效果不受到严重损失的前提下,对灰度图像压缩算法可以达到15到20的压缩比。如果在图像质量上稍微牺牲一点,则压缩比可以达到40:1,甚至更高。,要求: 该标准适用于各种多媒体存储和通信应用所使用的灰度图像、摄影图像及静止视频压缩文件。 (1)必须将图像质量控制在可视保真度高的范围内,同时编码器可被参数化,允许用户设置压缩或质量水平。 (2)压缩标准可以应用于任何一类连续色调数字图像,并不应受到维数、颜色、画面尺寸、内容、影调的限制。 (3)压缩标准必须从完全无损到有损范围内可选,以适应不同的存储、CPU和显示要求。,JPEG基本系统框图:,反变换,2.运动图像压缩标准MPEG: 运动

38、图像专家小组(MPEG)于1991年提出用于数字存储媒介的、速率约1.5MB/s的运动图像及其伴音的压缩编码,并于1992年正式通过。 运动图像的压缩包括两个主要方面:帧内压缩与帧间压缩。 帧内压缩:删除空间的数据冗余; 帧间压缩:删除帧与帧之间的时间冗余。删除时间 冗余可通过帧间编码来完成,即仅存储运动图像 从一帧到下一帧的变化部分,而不是存储全部图 像数,这样能极大地减少运动图像数据的存储 量,达到帧间压缩的目的。,MPEG-1标准: 1990年MPEG组织制定了MPEG-1标准草案,1993年8月正式通过。 MPEG-1标准旨在解决多媒体的存储问题,主要应用于数字存储媒介中活动图像及其伴

39、音的编码表示,数码率约为1.5Mbps。 MPEG-2标准: 为满足数字存储媒体、电视广播以及通信等应用领域对于“活动图像及其伴音的通用编码方法”的日益增长的需求,MPEG组织在1994年推出MPEG-2标准,数码率高达10Mbps。,MPEG-4标准 MPEG组织于1999年1月公布了全新的MPEG-4标准。MPEG-4标准的目标是达到低比特率下的多媒体通信和多业务的多媒体通信综合。 特点: 引入了对象的概念,就是用基于对象的方法得到分层区域。因此MPEG-4标准具有了内容,交互性、灵活与可扩展性三个重要特征。与前两个标准相比MPEG-4具有文件小、质量好的特点。,应用意义: MPEG-4标准的最大创新在于它的开放性,使用户可以针对应用建立个性化系统,因此很容易实现interent 的图像搜索引擎、基于内容的图象数据库检索和交互式的多媒体通信等功能,其具体应用为数字电视、交互式图形应用和交互式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论