(信号与信息处理专业论文)自适应技术在图像压缩中的应用研究.pdf_第1页
(信号与信息处理专业论文)自适应技术在图像压缩中的应用研究.pdf_第2页
(信号与信息处理专业论文)自适应技术在图像压缩中的应用研究.pdf_第3页
(信号与信息处理专业论文)自适应技术在图像压缩中的应用研究.pdf_第4页
(信号与信息处理专业论文)自适应技术在图像压缩中的应用研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要+ 自适应编码技术作为一类提高压缩比的有效方法,一直是图像压缩技术研究中的热 点。已往很多的自适应算法由于图像分块算法的局限性( 如分类非常有限,很难适应图 像块的变化) ,一直存在的诸如边缘失真较大,方块效应等问题。本文就是为了进一步解 决这样的问题,提出了两种分别利用图像空域和频域结构特征来进行自适应分块的方法: 基于图像边缘信息测度的自适应分块和基于d c t 谱主方向的自适应分块。并将这两种自 适应算法与d c t 编码方法及矢量量化技术结合,建立了基于边缘信息测度的自适应d c t 编码基于d c t 谱主方向的自适应d c t 编码和基于d c t 谱主方向的块分类矢量量化算法。 这也就构成了本文的主要内容。 首先提出了基于边缘信息测度的四叉树自适应分块的d c t 压缩算法。该方法首先建 立了一个基于图像空域结构特征的定量判别准则边缘信息测度,利用该测度能够很 好的区分出平滑点、纹理点、阶跃边缘和屋脊边缘点。进而根据这判别准则对输入图 像进行分块。最后根据分割好的各个块的大小和块内包含边缘点的多少来进行不同压缩 比的d c t 压缩编码。计算机模拟实验证明,这样的自适应分块方法,结合了边缘信息测 度和自适应分块的优势,提高了图像的压缩比和s n b r ( 传送一个比特时的信噪比) 。 其次为解决上述自适应分块所带来的附加比特开销问题,本文提出了一种块融合传 输及基于d c t 谱分布特征自适应分块的解码算法。使得编码时自适应分块算法的优势充 分发挥,更大的提高了自适应编码算法的压缩比。 接着本文建立了基于d c t 谱主方向的自适应d c t 编码算法,利用谱主方向及其特征 曲线,自适应地将平滑区和边缘区分开,再有区别的进行d c t 编码。这一算法解决了非 自适应分块情况下不能充分发挥d c t 谱主方向优势的问题,有效的提高了压缩比,是一 一种时间复杂度更低,压缩比更高的d c t 编码方法。 最后本文探讨了一种将基于结构特征的自适应分块与矢量量化相结合的编码方法。 在前两章的基础之上,建立了基于d c t 谱主方向的块分类矢量量化方法,针对分类后不 同细节子块设计不同的码书,进行分类矢量量化。实验结果证明,该方法比非自适应算 法具有更高8 n r 和m s e 。而且由于各类码书尺寸较小,因此降低了搜索码字的时间复 杂度。同时推导出一个最优化条件,在满足该条件的情况下由于记录码书索引而增加的 比特开销的影响就会被消除。最后还对几种不同的自适应分块算法与矢量量化结合的可 行性问题进行了探讨。 关键词:静态图像压缩;d c t ;自适应分块:边缘信息测度;d c t 谱主方向:矢量量化 最优条件 4 + 本课题属于国家交通部资助攻关项目:网络多媒体会议电视支持技术的研究 a b s t r a c t a d a p t i v et e e h i l i q u e sa l w a y sp l a ya ni m p o r t a n tm l en o to n l yi ns t i l li m a g ec o m p r e s s i o nb u t i nm o t i o ni m a g ec o m p r e s s i o ns t a n d a r d a l t h o u 曲m u c hs t u d i e si na d a p t i v ee n d i n gh a v eb e e n d o n ei nr e c e n tt e n sy e a r s ,m a n yo ft h e s es t u d i e sa l w a y sl e a dt od i s c o n t i n u i t yo ft h ea d j a c e n t b l o c k sa n db l o c ke f f e c t b e c a u s et r a d i t i o n a ld c tc o d i n gd e p e r i d st o om u c ho l ls t a t i m i c a lm o d e l i nc l a s s i f i e da d a p t i v eq u a n t i z a t i o nf o ri m a g eb l o c k s ,t h u sg i v er i s et oi m p r o p e rq u a n t i z a t i o no f s o m eb l o c k si nt h i st h e s i s ,t h es t r u c t u r ec h a r a c t e r i s t i c so ft h ei m a g ea r ea n a l y z e da n du t i l i z e d t os e g m e n tt h ei m a g ea d a p t i v e l y f i r s t l y , a na d a p t i v es e g m e n t a t i o nd c tc o d i n gm e t h o db a s e do ne d g ei n f o r m a t i o nm e a s u r e i sd e v e l o p e d a ni m a g ei sr e c u r s i v e l ys p l i ti n t od i f i e r e n t s i z e1 e a r - b l o c k s 、t h ee d g e i n f o r m a t i o nm e a s u r eb a s e do nt h es t r u c t u r ec h a r a c t e r i s t i t si sa d o p t e da st h es p l i r t i n gc r i t e r i o n e a c hl e a r - b l o c kw i l ib eq u a n t i z e db yd i f f e r e n tq u a n t i z a t i o nt e m p l a t ei nt r a n s f o r i i ld o m a i n t h e n ,t oe l i m i n a t et h ea d d i t i v eb i t c o n s u m p t i o n sr e c o r d i n gt h et y p e so fb l o c k s ,t h e b l o c k m e r g i n gt r a n s m i s s i o nm o d ea n dt h ea d a p t i v ed e c o d i n gb a s e do t lt h ed c ts d e c t r u m f e a t u r eo ft h eb l o c k sa r ed e v e l o p e dt h es i m u l a t i o ne x p e r i m e n t so nc o m p u t e rp r o v et h a tt h i s m e t h o dh a sh i g h e rc o d i n ge m c i e n e yt h a r tt r a d i t i o n a ld c tm e t h o d s s e c o n d l y , a na d a p t i v eb l o c ks e g m e n t a t i o nd c tc o d i n gm e t h o db a s e do nt h ed c t s p e c t r u mm a i no r i e n t a t i o ni sd e v e l o p e d t h ef o r m e rs t u d ys h o w e dt h a tt h ed i r e e t i o n a le d g eh a s o r i e n t a t i o ni ni t sd c ts p e c t r u md i s t r i b u t i o na n dd e v e l o p e dt i l ec o n c e p to ft h ed c ts p e c t r a n n m a i no r i e n t a t i o n b a s e do nt h i sc o n c e 此t h es m o o t ha n dt h ee d g ef i e l dc a nb es e g m e n t a d a p t i v e l y 。t h e nc o d e db yd c ts e p a r a t e l yt h i sm e t h o dt a k e sf u l la d v a n t a g eo ft h ec o n c e p to f s p e c t r u mm a i no r i e n t a t i o nw h i c hc a l ln o tb eu t i l i z e dv e r yw e l li nt h en o n a d a p t i v e s e g m e n t a t i o nm e t h o d a n di ti sp r o v e db yt h es i m u t a t i o ne x p e r i m e n tt h a tt h i sm e t h o de n h a n c e s t h ec o m p r e s s i o nr a t i o ,a n ds a v e st h er u n t i m e a tl a s t t h ea d a p t i v ev e c t o rq u a n t i z a t i o nc o d i n gb a s e do n 也ed c ts p e c t r u mm a i n o r i e n t a t i o nm e n t i o n e da b o v ai sd e v e l o p e du t i l i z i n gd c ts p e c t r u r nm a i no r i e n t a t i o n 血ei n p m i m a g ee a r lb ec l a s s i f i e d a n dt l l e nd i f i e r e n tc o d e b o o k sa r ed e s i g n e dr e s p o n d i n gt ot h ed i f i e r e n t k i n d so fb l o c k s e a c hc o d e b o o kh a ss m a l i e rs i z et h a no o ec o d e b o o ki nu n c l a s s i f i e dv e c t o r q u a n t i z 娟o n s ot h er u n t i m ec z nb ed e c r e a s e d i ti sp r o v e dt h a tt h i sm e t h o dh a sah i g h e r p s n r ,a n di fao p t i m i z i n gc o n d i t i o n ,w h i c hi sd e v e l o p e di nt h i sc h a p t e r , i ss a t i s f i e d ,t h e p r o b l e mo fl o w e rc o m p r e s s i o nm t i oc a u s e db ym u l f i - c o d e b o o k sc a nb es o l v e d a tt h ee n do f t h i sc h a p t e r , t l l ep e r f o r m a n c ea n da v a i l a b i l i t yo ft h ev qb a s e do ns o m eo t h e ra d a p t i v eb l o c k s e g m e n t a t i o nm e t h o d sa r ed i s c u s s e d k c y w o r d s :s t i l li m a g ec o m p r e s s i o n ;d c t ;a d a p t i v es e g m e n t a t i o n ;e d g ei n f o r m a t i o n m e a s u r e ;d c ts p e c t r u mm a i no r i e n t a t i o n ;v e c t o rq u a n t i z a t i o n :o p t i m i z a t i o nc o n d i t i o n 1 j 1 自适应技术在图像压缩中的应用研究 l 绪论 1 1 本文的理论依据和研究目的 图像压缩的核心问题始终是如何对数字化的图像进行数据压缩,以获得最小的数据, 同时尽可能保持图像的恢复质量。随着应用的深入、人们对图像压缩编码提出了越来越 高的要求,需对原有的传统方法进行改造或进一步研究,以便找到更佳的方法。进一步 的。在各种压缩标准中,无论是针对静态图像还是运动图像的,对于静态图像的压缩技 术始终是关键的问题。比如在m p e g 标准中,视频序列被分为三种类型的帧:i 一帧( i n t r a p i c t u r e ) ,p - 帧( p r e d i c t e dp i c t u r e ) 和b 一帧( b i d i r e c t e dr i c t u r e ) 1 1 1 而对于i 帧图像基 本上就是采用静态图像压缩方法。因此,寻求更有效的静态图像压缩算法是菲常有必要 的。 在静态图像压缩算法中离散余弦变换( d c t ) 编码作为是种经典的图像压缩编码方 法,仍然有着广泛的应用范围。例如在静态图像压缩标准j p e g 的核心算法,以及视频 会议标准h 2 6 l 及h 2 6 3 ,还有运动图像压缩标准m p e g 中e 帧的基本编码算法都是基于 d c t 的,因此寻求更高压缩率的编码方式,对d c t 编码不断的改进有勒于各类压缩标准 更好的应用在信息传输技术中。几十年来,研究人员利用它的能量集中的优点进行了大 量的编码量化研究但由于这些方法都是基于传统的对d c t 谱分布的认识而建立的,使 个别图像子块量化不当,造成相邻图像子块之间不连续并呈现方块效应。1 9 9 7 年西安交 大博士生刘春阳提出了基于d c t 谱主方向和三维d c t 的压缩编码1 2 j ,其压缩效率比传统 的o c t 有较大的提高,而又容易与标准靠拢。他在研究中发现d c t 谱的分布与块内图像 的边缘复杂度有关,而且能量主要集中在与边缘垂直的一个楔形的带中,而不是集中在 左上角的一大片区域中。因此,如果能自适应的将平滑区和边缘区分开,将会有效地提 高压缩比。但刘春阳的文章中没有考虑自适应分块的问题。而自适应的问题不得以解决, 将不能很好的体现出d c t 谱楔形分布的优势来本课题就是在前面研究的基础之上,产生 了自适应分块的初步思想。 在已有的研究中,已经提出了多种自适应编码方法,可归纳为:( 1 ) 由图像块多尺 度自适应图像变化的自适应编码p h 4 】,其实现的主要思想是对含有复杂边缘的区域细分 割,而对平缓区域祖分割:( 2 ) 另一种是通过对图像块简单分类并对每一类设计比特方 案或量化矩阵来适应图像变化的编码 5 - 8 1 ;( 3 ) 构造数学模型,通过此模型对图像块分类, 进行自适应编码驯:( 4 ) 将上面几种方法结合的自适应编码。这些方法在压缩比方面己 取得了一些进展。但对图像块分类依据基本上基于块内的统计特r 眭,这并不能很好地反 应图像的结构信息,不能更好地将含边缘的区域与平滑区域分开,因而算法自适应能力 降低。本论文的工作针对这缺点,利用了图像的边缘信息测度和d c t 谱主方向为准则 分别研究了几种不同的自适应分块的方法并与d c t 及矢量量化编码方法相结合。从多 个角度研究了自适应算法在静态图像压缩中的应用。 需要指出的是,选择这研究方向对于个有时间限制的硕士阶段来说是有定风 ! 重坚垫查垄璺堡垦堕主竺壁星堕塞 一一 险的。因为,自适应压缩编码已经有许多研究成果,本课题是否能有所创新? 从具体实 现的角度想,一个直接的风险是:一般来说,块分类总要有额外的比特开销,这很可能 使最后的压缩比没有改善。研究的过程也确实证实了一些想法的不成功。比如,在第3 章中尝试了基于边缘信息测度的自适应矢量量化方法就没有明显好的效果,基于边缘信 息测度的自适应分块的d c t 编码的时间开销较大。但幸运的是,总的研究仍然取得了很 多新的进展。在基于d c t 谱主方向的自适应分块研究中,提出了无比特开销的方法,而 且在压缩比、恢复质量和时间开销方面都有较满意的结果,基于边缘信息测度的自适应 分块的d c t 编码虽然时间开销较大,但压缩比和恢复质量有较满意的结果,基于d c t 谱主方向的自适应矢量量化虽然存在有待解决的问题( 将在第3 章详细讨论) ,但它的总 体效果还是令人满意的。 为了能更好地说明本论文工作的意义,以下对相关的图像压缩技术加以回顾。 1 2 图像编码技术分类 图像压缩技术在数字电视、网络多媒体通信、会议电视、可视电话、遥感图像传输、 图像数据库、自动指纹识别系统的指纹存储等应用中起着至关重要的作用。图像压缩技 术利用了数据固有的冗余性和不相干性,将个大的数据文件转换成较小的文件。由压 缩的文件可以在以后需要的时候以精确的或近似的方法将原文件恢复出来。两个文件的 大小之比确定了压缩的程度。i i o j 图像编码的方法很多,可以多种方法对其进行分类。一种分类方法是将编码方法分为 无损编码和有损编码,前者能精确的重建原始图像,而后者会引入失真,只是它尽量使 失真不明显。另一种分类方法是基于编码方法的应用域。例如,以适当的方式综合各像 素值的方法称为空间法;利用一组变换系数的方法称为变换法;既利用空间域,又利用 变换域的方法则称为混合法。还有一种分类方法是将编码方法分为固定方法和自适应 方法。根据恢复图像的准确程度可将常用的图像编码方法分为三类:一是信息保持编码; 而是保真度编码;三是特征抽取编码。信息保持编码技术主要用于图像的数字存储方面, 它是一种无失真编码技术,其压缩比较低,如x 射线图片就不能用有失真编码技术,否 则会引起误诊。保真度编码技术大都应用在数字电视技术和静态图像通信中。由于人眼 感受不到过高的分辨率和过多的灰度层次,故通常允许编码构成丢失一些对信宿无用或 作用不大的的信息,也就是在允许失真条件下或一定的保真度准则下进行有损压缩编码。 而特征抽取一般用于识别、分析遥感图像,因为特征抽取往往不需要全部图像信息,例 如对卫星照片进行农植物分类时,人们只关心农植物和非农植物的图像特征,而不关心 道路、河流等特征,这是就可用大压缩比对图像进行压缩。 另外,基于不同的出发点和应用场合,编码方法还可以有多种分类。如:从光学特 征出发分为单色图像和彩色图像编码:从灰度层次出发,分为二值图像和多值图像编码; 还有静止与活动图像编码等这些方法之间互相重叠、影响,不能截然分开。从图像编码 的发展历史及发展前景来看,许多学者把图像编码归为“经典图像编码方法( e l a s s i c a l ) ” 和“现代图像编码( m o d e m ) ”,后者强调了对视觉特性的充分利用,虽然理论上,没有 突破信息论的原有框架,但作为对图像编码几十年来的一种总结,这样分类也是合情合 理的【2 。 ! 垩嬖苎查垄里堡里堕主箜壁旦里圣 常用的图像编码技术有如下几种:脉冲调制( p c m ) 、预测编码、离散余弦变换、 小波变换、分形编码、矢量量化、神经网络、运动补偿、h u f f r a a n 编码等。本文工作的 重点是静态图像的压缩技术,因此下面我们将按照静止图像编码方法的不同类别着重介 绍一下静态图像编码方法的发展现状。 1 3 静态图象压缩方法概述 1 3 1 预测编码 由o l i v e r 】在1 9 4 8 年提出的电视信号的线性p c m 编码开始,图像编码研究才真正开 始,同时提出了图像编码频带压缩这一未来方向。 预测编码有线性预测和非线性预测两类,他们可以在一幅图像内进行( 帧内预测编 码) ,也可以在多幅图象之间进行( 帧间预测编码) 。预测编码基于图象数据的空间和 时f 司冗余特性,用相邻的已知象素来预测当前象素的取值,然后在对预测误差进行量化 和编码。这些相邻象素可以是同行扫描的,也可以是前几行或前几帧的,相应的预测编 码分别称为一维、二维和三维预测,其中一维和二维预测是帧内预测。三维预测是帧间 预测,预测编码的关键在于预测算法的选取,这与图象信号的概率分布很有关系,实际 中常根据大量的统计结果采用简化的概率分布形式来设计最佳的预测器,有时还使用自 适应预测器以较好的刻划图象信号的局部特性,提高预测效率。但是此方法是建立在信 源的平稳性和局部相关性之上的,它只能消除局部几个像素的相关性。由于实际图像是 不平稳的,例如在图像边缘和细节丰富的区域,像素值变化剧烈且缺乏相关性,预测性 能较差,实际研究表明预测编码的压缩比较低,同时存在错误传播的危险,所以研究工 作者一直还在探索改进方法。 1 3 2 块变换编码 分块变换编码是进行图像压缩的最常用算法。通常图象被分成小块,然后分别对他们 进行变换。这样可以简化变换过程,尤其是必须计算特征向量的时候。块变换起源于六 十年代末,最初a n d r e w 和w k p r a t t 分别提出了利用傅立叶变换和哈达码变换研究图象 编码,从而开始了利用块变换编码的研究。图象编码工作者一直想寻求一种最佳变换, 在1 9 7 1 年由a h a b i b i 和p w i n t z 提出利用k l 变换研究图象编码,k l 变换算法源于1 9 3 3 年h o l l e t i n g 的工作提出的变换,随着时间的推移,被人们称为h t 变换、p r i n c i p l e c o m p o n e n t 变换和e i g e n v e t o r 变换,到后来称为k a r h u n e n l o e v e 变换。k l 变换被证明是基于均方差 最小的变换,称为最佳k l 变换。但是k l 变换运算复杂度太大。试想对每一幅数字图象 都要进行一次k l 变换计算协方差矩阵及特征分解,简直是不可想象的。后来有人提出 t d c t 变换,并证明d c t 是目前现有变换中与k _ l 变换基于概率失真理论最近的变换。 d c t 变换有非常好的优点如正交性以及变换矩阵是不随图象变化的,再加上提出的一些 快速算法,使它的运算复杂度大大降低,随着计算机硬件的不断发展,使用d c t 变换实 时处理成为可能,这更进一步说明d c t 变换在块变换中的重要性。 随着对图像编码的深入研究,发现图像的边缘信息对人眼视觉影响极大,为了保 ! 垩生垫查垄里堡垦竺生塑生里要塞 一 护边缘信息,逐渐抛弃了均匀量化。提出了各种自适应编码方法。就d c t 变换而言,当 压缩比增大时,常出现边缘较大失真( 高频信息失真大) ,方块效应等,这显然是由于 d c t 变换后,量化对高频信息处理不当所致。目前有不少消除块效应的算法。文献 1 2 利用空间不变滤波器对编码以后的图象进行后处理;文献 1 3 1 4 p n 用空间可变滤波器对 解码图进行滤波处理。y a n g 等人基于凸集投影原理( p o c s ) 把解码后的块图往一系列平滑 约束集上做连续投影变换,最后得到的解码图能有效的消除块效应l l ”。但由于这一算法 没有考虑到图象的局部特征,解码图象会丢失一部分局部细节。进入八十年代后期,许 多科研工作者试图引入人眼视觉特性【l6 】提高压缩比,从而提出了基于小波变换、分形、 神经网络等所谓第二代图像编码,而d c t 只作为辅助工具与其他方法混合设计图像编码 方案【4 】。这些方法中小波变换。神经网络最接近人眼视觉结构特性,特别小波变换编码 已得到很大的进展,但目前仍还不能替代d c t 变换实现类似j p e g 的方案。 1 3 3 矢量量化编码 自从1 9 8 0 年l i n d a ”l 等人提出矢量量化的码本设计算法( 称为l b g 算法) 以来, 基于矢量量化图像编码有了很大进展。矢量量化是实现高压缩比的有效方法,近年来, 矢量量化技术已广泛应用于图象数据的压缩。压缩机理是先将k ( k 2 ) 个抽样值形成 k 维欧式空间的一个矢量,然后将此矢量进行量化,所以可以大大降低编码率。 矢量量化的理论基础是香农的速率失真理论。根据该理论,即使信源是无记忆的, 利用矢量编码代替标量编码总能在理论上得到更好性能。v q 在图像编码中有很大的应用 潜力,此算法的关键是码本的设计,而码本与训练样本图像的选择有关。许多研究工作 者主要集中在研究码本设计算法,快速量化算法和各种v q 应用方案上。最具有代表性 的有:( 1 ) 多级v q ( m v q ) 【i 列:它是将编码过程分为几个态,首先对小码本粗略编码, 然后对选配的矢量与原矢量作差,生成差矢量,第二态量化是对差矢量重复上面的过程, 有几个态就重复几次,这就产生了逐步逼近过程。( 2 ) 预测v o ( p v q ) :它是引用了d p c m 思想的方法,对输入向量根据前面矢量编码来预测编码,对预测矢量与输入矢量作差,生成 残余矢量,对残余矢量再进行v q ( 3 ) 分类v q ( c v q ) 1 9 1 :它是对输入的矢量进行分类,产生 索引码,然后在码本内查找最近的向量编码,这样生成二类数据,一类为码本索引码,另一类 为在码本内的向量索引码( 4 ) 有限态v q ( f s v q ) :类似于c v q 方法,f s v q 是多码本v q , 被编码的矢量划到最近的码本,但与c v q 方法不同的是没有索引码,既没有辅助的信息给 解码器尽管v o 具有很大的压缩能力,但是由于巨大运算复杂度和其它方面的缺陷,v q 并 没有在图像编码中得到广泛的应用近年来有些学者开始研究格型v q ( t c v q ) t 加 2 1 1 ,它在 图像应用中取得了初步进展格型v q ( t v c q ) 是有许多引人注目的新特点,它可以看成 f s v q 方法的延伸t v c q 是通过生成超码本,再将它划分成若干予码本,并允许在几个子 码本内找出最佳码字来编码随着v o 的不断深入研究和完善,许多科研工作者将它与其他 方法如小波变换、d c t 变换等结合,取得可喜的进展。 i 3 4 第二代图象编码方法 第二代图象编码方法是针对传统编码方法中没有考虑人眼对轮廓、边缘的特殊敏感 性和方向感知特性而提出的。它认为传统的第代编码技术以信息论和数字信号处理技 自适应技术在图像压缩中的应用研笼 术为理论基础,出发点是消除图象数据的线性相关性等统计冗余信息,其编码压缩图象 数据的能力已接近极限,压缩比难以提高。第二代图象编码方法不局限于s h a n n o n 信息 论的框架,要求充分利用人类视觉系统的生理和心理特性以及信源的各种性质以期获得 高压缩比。【1 l 这类方法一般要对图象进行预处理,将图象数据根据视觉敏感性分割。 1 3 5 小波变换编码 小波变换是f o u r i e r 交换、g a b o r 变换很短时f o u r i e r 交换等在数学上的一个自然延伸 【硐1 由于具有良好的空问频率局部化特性。主要表现在:( 1 ) 频率压缩特性,即原始图 象的能量大部分集中到低频子带;( 2 ) 空间压缩特性,即高频子带的能量大部分集中在 原始图象的边缘等对应位置:( 3 ) 系数分布的相似性,即同一方向各级高频子带系数幅 值分布大体一致。r i n a l d o 的块预测方法 2 4 1 就是为了利用小波系数分布的相似性,它是通 过对每一级图象进行分块,并将每块都用上级相同方向上的相应- 决进行幅值伸缩和 变换后,来进行预钡4 ,但这种方法目前还没有的到充分的研究,且已有的相关算法较为 繁琐可操作性不够强。1 9 9 2 年,s h a p f i o 提出的零树压缩算法【2 5 】则是通过把不重要的小 波系数组织成四叉树,由于他能用较少的比特数来表示,因此可以认为,零树压缩部分 实现了对级问系数分布相似性的利用。这种零树提供了一种同方向但不同分辨率子带图 象上小波系数互相联系的数据结构。有些学者认为,s h a p f i o 的零树概念是小波图象编码 研究的一个里程碑。小波变换在信号处理中非常适合于非平稳信号分析。自适应的选择 小波及小波基可以是某种意义下的分解成为最优。小波变换的提出为信号处理领域里原 来各自独立的方法,如多尺度分析、拉普拉斯金字塔、多采样率滤波器组等提供了统一 的理论框架,而且二进小波变换也有类似f f t 的快速m a l l a t 算法【2 6 】 1 3 6 分形编码 利用分形可以生成看起来非常自然的图像,因而研究工作者就提出了自然图像能否由分 形来生成的问题f m b a r n s l e y 和a d ,s l o a n l 2 n 展示了他们取得的成果:有机器生成的图像 可以取得0 0 0 8 6 的压缩比率,但是逆问题并没有取得实质性突破理论上讲分形虽给图像 压缩提供了一条途径,但阃题是如何寻找一些相关技术,以兢获得最好的压缩效果直到 1 9 9 2 年a j a c q u i n 提出分块迭代函数系统( p i f s ) 的方法,才使分形压缩成为可行的方法由 于p i f s 是以小块为处理单元进行迭代,所以压缩比受到了很大的限制,要求图像质量较好 时,一般压缩比在1 b p p 到0 1 6 b p p 之问,并不能达到传说中的0 0 0 8 b p p 奇迹目前分形的定 义在数学上有很多讨论,由于分形图象编码的基于图象的自相似性跚【2 9 】,因此,近年来, 一些学者不断得在研究利用分形图象编码的一些方法来发掘和利用经过小波分解后所表 现出来的相似性。如1 9 9 5 年,r i n a l d o 和c a l v a g n o 利用分形图象编码中的分形匹配方法, 实现了用低分辨率的子带图象来进行同方向高一级分辨率子带图象的预测t 3 0 ;1 9 9 6 年, l e v y 和w i l s o n 也发表过类似的研究结果阱1 ;1 9 9 8 年,d a v i s 把零树的概念引入到分形图 象编码,并把分形图象编码中的相似块( d o m a i nb l o c k ) 和图象块( r a n g eb l o c k ) 扩大 为相似树( d o m a i nt r e e ) 和图象树( r a n g e i r e e ) ,从而使得相似树与图象树之间的分形 匹配【3 2 】。 自适应技术在图像压缩中的应用研究 1 3 ,7 人工神经网络( a n n ) 编码 与视觉系统知识紧密相关的压缩方法是利用人工神经网络( a n n ) 的方法,a n n 并 行分布的联结机制在某种意义上与人的视觉系统( 从视网膜直到大脑皮层) 相似,利用 a n n 进行变换编码,可以用t t e b b 准则来训练网络,使网络权重收敛到各个元素的主分量 ( k l 变换) 如j , g s a n g e r 提出的广义h e b b 方法l o c h u a 和t l i n 用神经网络实现传统的 图像变换编码他证明,传统变换编码中”三步”处理( 空域图像数据的正交变换,变换数据 量化和量化数据的二进制编码) 可归结为“一步”完成的最优化问题,此问题可以通过 构造合适的h o p f i l d 神经网络来解决,输入网络是空间域图象数据,输出的是二进制代码, 利用上面所提的a n n 算法的原理及它们的改进方法进行图象压缩获得了较好的效果。 a n n 的突出优点在于它的非线性,这种优点使应用b p 算法的多层感知网络来实现 d p c m 编码取得理想效果,这是由于所得的预测误差的方差往往较小,使d p c m 的编码 效率有所提高。还可以利用a h 默来实现非线性的自回归( a r ) 模型【3 3 1 ,由于此方法引 进了高阶项,傻它能更好地预测图像中的高频成分。a n n 另一优点是利用自组织映射 ( s o f m ) 来矢量量化,它与传统v q 相比,用s o f m 方法生成码本速度快,对初始码 依赖性小,且码本普适性好。s o f m 算法有如下优点:( 1 ) 特征向量集是原输入空间的 优化逼近:( 2 ) 特征向量是按拓扑排序的;因此向量之间的相关性随它们之间的距离减 少而增加。( 3 ) 特征映射的密度与输入分布密度相对应,因而带有高概率密度的区域比 带有高概率密度的区域求解更容易。特别值得指出的是优点( 2 ) ,由于s o f m 方法在调 整某个神经元权重时,也要调整周围元素的权重,从而使生成的码本在拓扑结构上有 定的关系,这一点可以被进一步用来消除编码冗余 3 4 l 以及设计有限状态v q 算法口5 1 和多 层次的v q 方法,从而提高了压缩比及图像质量。 1 4 静态图像压缩标准 十几年来,图像编码技术得到了迅速发展和广泛应用,并且日臻成熟,其标志就是 几个国际图像标准的制订,如由i s o i e c 提出的关于静止图像的编码标准j p e g 和 j p e g 2 0 0 0 ,c c i t t 关于电视电话和会议电视的视频编码标准h 2 6 1 ,面向可视电话的h 2 6 3 , 以及i s o i e c 关于动态图像的编码标准m p e g 1 ,m p e g - 2 ,m p e g 4 ,m p e g 7 ,已经从2 0 0 0 年6 月开始研究的支持通过异构网络和设备使用户透明而广泛地使用多媒体资源的标准 m p e g 一2 1 等等。这些标准图像编码算法融合了各种性能优良的传统图像编码方法,是对 传统编码技术的总结,代表了当前图像编码的发展水平。下面我们重点介绍针对静态图 像压缩的j p e g 及j p e g 2 0 0 0 标准。 1 4 1 j p e g ( j o i n tp h o t o g r a p m ce x p e r t sg r o u p ) j p e g ( j o i n t p h o t o g r a p h i ce x p e r t sg r o u p ) 是联合图片专家小组的缩写。在图像采集、 处理与传输的硬件中,为了使不同厂商的产品具有图像压缩共同的依据和兼容性,各公 司部重视建立通用的图像压缩标准。1 9 8 6 年由c c i t t 和i s o 两个国际组织联合成立了一 个联合专家小组简称j p e g ,致力于建立适合于彩色和单色多灰度的连续色调静态图像的 压缩标准,1 9 9 1 年形成i s o i e c l 0 9 1 8 文件,1 9 9 2 年正式成为一个适用于连续色调、多 自适应技术在图像压缩中的应用研究 级灰度、彩色或单色静态图像数据压缩国际标准。 j p e g 中允许四种编解码模式【l i : ( 1 ) 串行d c t ( s e q u e n t i a ld c t ) 方式: ( 2 ) 逐渐浮现式d c t ( p r e g r e s s i v ed c t ) 方式; ( 3 ) 无失真( 1 0 s s l e s s ) 方式: ( 4 ) 分层次( h i e r a r c h i c a l ) 方式。 其中,( 1 ) 和( 2 ) 是基于d c t 方法:( 3 ) 是线性预测方法;( 4 ) 可以是d c t ( b pl o s s y 方法) 与有损方法的分层混合。 j p e g 定义了一个基本系统( b a s e l i n es y s t e m ) ,它是d c t 方法的最简单形式,电是串 行d c t 的一个子集。一个符合j p e g 标准的编解码器( c o d e c ) 至少要满足基本系统的技 术指标。下面对此作一简要介绍。 基本的j p e g 算法属于变换类编码。在实际应用中,彩色图像又不同的方法表示, 如r g b 三基色法、电视中的y u v 法和印刷业中的c m y k 法等。每一个表示部分称为是 一个分量。对原始图像的每一个分量,首先分割成不重叠的8 * 8 象素块,然后作8 * 8 的 二维d c t 变换。得到的6 4 个系数代表了该图像块的频率成分。在8 * 8 的系数矩阵中, 左上角的一个叫做直流( d c ) 系数,其余6 3 个叫交流( a c ) 系数,从左到右,水平频率 增高,从上到下,竖壹频率增高。接着,对d c t 系数量化,再用z 字形扫描将系数矩阵 变成一维数列,各项按频率由低到高顺序排列。接下去就是具体的编码。 d c 系数使用差分编码,即对同一成分内相邻块的d c 系数之差作h u f f m a n 编码。对 a c 系数,首先进行游程编码,使得一串系数表示为几个事件。一个事件指的是一个非零 系数及其前面的连零长度的组合。因为高频的a c 系数多数是零,对上述事件作h u f f m a n 编码会有效地压缩数据量。 j p e g 的解码过程与编码相反,所以j p e g 也称为对称型算法。图1 4 1 给出了标准 j p e g 压缩和解压缩过程。 b l o c k so f8 * 6p i x e l s 一。 图1 4 1 标准j p e g 压缩过程 f i g1 4 1t h ec o m p r e s s i o n p r o c e s so f n o r m a lj p e g ! 垩生垫查奎望堡曼堕塑壁旦型壅一 i 4 2 j p e g 2 0 0 0 州 随着多媒体应用领域的激增,传统j p e g 压缩技术已无法满足人们对多媒体图像资料 的要求。因此,更高压缩率以及更多新功能的新一代静态图像压缩技术j p e g2 0 0 0 就诞 生了。j p e g2 0 0 0 正式名称为:i s o1 5 4 4 4 ,同样是由j p e g 组织负责制定。该标准是由联 合摄影专家组于1 9 9 7 年开始征集提案1 ,把它作为j p e g 标准的一个更新换代标准。 它的目标是进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,以及医疗 图像、电子图书馆、传真、i n t e r n e t 网上服务和保安等方面的应用。国际标准化组织的 w g l 小组己于2 0 0 0 年8 月制定了最终的国际标准化草案( t h ef i n a ld r a f ti n t e r n a t i o n a l s t a n d a r d ,简称f d i s ) 。j p e g 2 0 0 0 的编码算法一经确定,许多著名的图形图像公司如 c o r e l 、p e g a s u s ( 美国神马成像公司) 等就在新开发的图像工具软件中集成了j p e 6 2 0 0 0 图像压缩技术:而m i c r o s o f t 、n e t s c a p e 等在浏览器领域竞争的公司也开始将j p e g 2 0 0 0 的新技术集成到其下一个版本的浏览器中因为相对于j p e g 来说,j p e g 2 0 0 0 可以说具 有革命性的改变。 j p e g2 0 0 0 与传统j p e 6 最大的不同,在于它放弃j p e 6 所采用的以离散余弦变换算 法( d c t ) 为主的区块编码方式,而改用以离散小波变换算法为主的多解析编码方式。d c t 是经典谱分析常采用的工具,它考察整个时域过程的频域特征或整个频域过程的时域特 征,而对于非平稳过程,这种算法则显得力不从心。图像数据被压缩成正方形8 8 的“像 素信息模块”并按照一定顺序排列存储形成压缩文件,每一次压缩都需要舍弃若干频率 信息,压缩得越多,舍弃的频率信息也越多,经过彻底压缩后的图像文件将只保留最为 重要的数据信息,这样的压缩过程在图像细腻平滑程度方面必然有所损失。 离散小波变换算法( d i s c r e t ew a v e l e tt r a n s f o r m ,d w t ) 是现代谱分析工具,在包括 压缩在内的图像处理与图像分析领域正得到越来越广泛的应用。这种算法对于时域或频 域的考察都采取局部的方式,所以对于非平稳过程也一样十分有效。小波在信号分析中 对高频成分采用由粗到细渐进的时空域上的取样间隔,所以能够像自动调焦一样看清远 近不同的景物并放大任意细节,是构造图像多分辨率的有力工具。 此外,j p e g 2 0 0 0 还将彩色静态画面采用的j p e g 编码方式、2 值图像采用的j b i g ( j o i n t b i n a r yi m a g eg r o u p ) 编码方式及低压缩率采用j p e g l s 统一起来,成为对应各种图像的 通用编码方式。j p e g 2 0 0 0 的主要特征如下0 7 ”1 : 高压缩率:由于在离散子波变换算法中,图像可以转换成一系列可更加有效存储 像素模块的“子波”,因此,j p e 6 2 0 0 0 格式的图片压缩比可在现在的j p e g 基础上 再提高1 0 3 0 ,而且压缩后的图像显得更加细腻平滑,这一特征在互联网和 遥感等图像传输领域有着广泛的应用。 无损压缩和有损压缩:j p e 6 2 0 0 0 提供无损和有损两种压缩方式,无损压缩在许多 领域是必须的,例如医学图像中有时有损压缩是不能忍受的,再如图像档案中为 了保存重要的信息较高的图像质量是必然的要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论