(信号与信息处理专业论文)基于小波零树编码的身份照片压缩算法的研究与实现.pdf_第1页
(信号与信息处理专业论文)基于小波零树编码的身份照片压缩算法的研究与实现.pdf_第2页
(信号与信息处理专业论文)基于小波零树编码的身份照片压缩算法的研究与实现.pdf_第3页
(信号与信息处理专业论文)基于小波零树编码的身份照片压缩算法的研究与实现.pdf_第4页
(信号与信息处理专业论文)基于小波零树编码的身份照片压缩算法的研究与实现.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

武汉理工大学硕士学位论文 摘要 身份照片是一类用于身份标识的特殊照片,它广泛地存在于各种档案和 证件之中。由于身份照片尺寸较小的缘故,人们通常不去对它进行压缩。近 年来,随着相关技术的发展和身份管理系统的升级,出现了新一代的磁卡、 二维条形码和i c 卡等信息存储式身份证件。我国即将换发的第二代身份证就 是i c 卡身份证。这类证件较传统的身份证件最大不同之处在于,它所记录的 信息不仅仅以文字或图像的形式直接显示在证件表面,而是有大部分的信息 存储在卡上的条形码或芯片之中。作为个人身份极为重要的信息之一,身份 照片是新一代证件重点的存储对象之一。 然而,无论是二维条形码还是i c 卡,存储容量都非常有限。p d f 4 1 7 二 维条形码最大的容量为1 0 2 4 字节。i c 卡的内部存储器的容量虽然可以做得 很大,但成本也会相应的的提高。一张普通1 寸左右的2 5 6 级灰度身份照片, 大小就在8 k 字节左右,彩色的就更要大。要在条形码或i c 卡中存储身份照 片和其它个人信息( 如:文字、指纹等信息) ,就必须对身份照片进行压缩。 对身份照片的压缩已成为条形码,i c 卡等信息存储式身份证件的核心技术之 本文以身份照片中最为常见的1 寸黑自身份照片为压缩对象。研究了用 小波零树编码( e z w ) 和感兴趣区域( r o i ) 编码相结合的方法对身份照片进 行压缩的具体实现。本文的压缩方法对身份照片进行压缩所获得的压缩质量 和视觉效果要优于用普通的e z w 编码对身份照片进行压缩所获的压缩质量 和视觉效果,特别是面部区域的视觉质量得到了较大的提高。从而论证了在 e z w 编码中引入感兴趣区域编码对身份照片进行压缩是有效的。论文中第一 章,介绍了图像压缩的基本原理,本文的选题背景和意义。并阐述了国内外 身份照片压缩的现状、达到的水平和采用的主要技术。在此基础上提出了本 文的研究目标,并简要的介绍了研究的主要内容、方法和技术路线。第二章, 对小波零树编码算法的理论基础一一小波理论作了简要的介绍,包括小波变 换的时频局部特性、多分辨率分析、离散信号的快速分解与重构以及小波与 滤波器组的关系。第三章,介绍了小波零树编码和感兴趣区域编码,并讨论 了如何在小波零树编码的算法框架内实现感兴趣区域编码。第四章,详细的 武汉理工大学硕士学位论文 阐述本文对身份照片压缩的实现,并且给出了实验的结果。这一部分主要包 括:整个压缩方案的设计,感兴趣区域的分割,小波变换的实现,轮廓编码 和实验结果。第五章,对全文的研究工作进行总结,并对今后的研究方向进 行展望。 关键词:图像处理;身份照片压缩;嵌入式小波零树编码;感兴趣区域编码 武汉理工大学硕士学位论文 a b s t r a c t p e r s o n a li d e n t i f i c a t i o np i c t u r ei sak i n do fs p e c i a lp i c t u r e ,u s e dt oi d e n t i f y p e r s o n a li d e n t i t y i t i sc o m p r e h e n s i v e l ye x i s t e di na l lk i n d so fa r c h i v e s , c e r t i f i c a t e sa n ds oo ni nt h ep a s t ,b e c a u s eo fi t ss m a l ls i z e ,i tw a sn o t c o m p r e s s e d i nr e c e n ty e a r s ,b yt h ec o r r e s p o n d i n gt e c h n o l o g i e s d e v e l o p i n ga n d t h e i d e n t i t ym a n a g e m e n ts y s t e m su p d a t i n g , n e w g e n e r a t i o n o f i n f o r m a t i o n s t o r e di d e n t i t yc a r dc a m eo u t ,s u c ha s2 - d i m e n s i o nb a rc o d ec a r da n d i cc a r d f o ri n s t a n c e ,c h i n a ss e c o n dg e n e r a t i o nc i t i z e ni dc a r d ,w h i c hw i l lb e u s e di nn o tf a rf u t u r e ,i sak i n do fi cc a r d t h eb i g g e s td i f f e r e n c eb e t w e e n t r a d i t i o n a lc a r da n di n f o r m a t i o n - s t o r e dc a r di st h a tt h el a t t e rn o t o n l y h a s i n f o r m a t i o np r i n t e do nt h ec a r d ss u r f a c e ,b u ta l s os a v em o r ei n f o r m a t i o ni nt h e b a rc o d eo ri co ft h ec a r d p e r s o n a li d e n t i f i c a t i o np i c t u r e ,t h em o s ti m p o r t a n t p e r s o n a li n f o r m a t i o n ,i so n eo fs t o r i n gc o n t e n t so fn e wg e n e r a t i o nc a r d h o w e v e r ,e i t h e rt h e2 - d i m e n s i o nb a rc o d e ,o rt h ei c c a r dh a sl i m i t e d c a p a c i t y t h ec a p a c i t y o f2 - db a rc o d ec o m m o n l yi s10 2 4b y t e s i cc a r d s m e m o r yc a p a c i t y i s l a r g e rt h a n2 - db a rb u tc o s t i n c r e a s e sw i t hc a p a c i t y s i n c r e a s i n g ap i e c eo fo r d i n a r yi d e n t i t yp i c t u r eu s u a l l yh a sa tl e a s t8k i l o b y t e s s o t os t o r ei ti nt h eb a rc o d eo ri cc a r d i ts h o u l d b ec o m p r e s s e d t h e c o m p r e s s i o no fi d e n t i t yp i c t u r eh a sb e e nak e yt e c h n o l o g yo fn e wg e n e r a t i o n i d e n t i t yc a r d i nt h i sp a p e r ,1i n c hp e r s o n a li d e n t i f i c a t i o np i c t u r e s w h i c ha r ev e r yc o m m o n a n du s e dt o d a y a r et a k e na sc o m p r e s s i n go b j e c t r e s e a r c h i n gw o r k si n c l u d e e m b e d d e dz e r ow a v e l e tc o d i n ga n dc o d i n gb a s e do nr e g i o no fi n t e r e s t c o m p r e s s i o nq u a l i t ya n dv i s u a le f f e c to fp e r s o n a li d e n t i f i c a t i o np i c t u r eo ft h i s p a p e r 。sm e t h o da r eb e t t e rt h a nt h o s eo ft h eb a s i ce z wc o d i n g ,w h i c hj u s t i f yt h e e f f e c t i v e n e s so fr o ic o d i n gi nt h ef i r s tc h a p t e r , i m a g ec o m p r e s s i o n sp r i n c i p a l , s i g n i f i c a n c e a n d b a c k g r o u n d o ft h e s i s s e l e c t i o na r ei n t r o d u c e d w h e r e a s p e r s o n a l i d e n t i f i c a t i o np i c t u r e sc u r r e n tc o m p r e s s i n gl e v e li nt h ew o r l d ,t h e m a i n l yu s e dm e t h o da l s oa r ee x p o u n d b a s e do nt h e s e ,t h i sp a p e r sr e s e a r c ha i m i 1 1 武汉理工大学硕士学位论文 i s b r o u g h tf o r w a r d r e s e a r c h s m a i nc o n t e n t ,m e t h o da n dt e c h n o l o g ya r e i n t r o d u c e ds u b s e q u e n t l y i nt h es e c o n dc h a p t e r ,w a v e l e tt h e o r y ,w h i c hi st h e t h e o r e t i cb a s i so fe m b e d d e dz e r ow a v e l e tc o d i n gi si n t r o d u c e db r i e f l y ,i n c l u d i n g w a v e l e tt r a n s f o r m sl o c a lc h a r a c t e r i s t i c s ,m u l t i r e s o l u t i o na n a l y s i s ,d i s c r e t e s i g n a l 7 sf a s td e c o m p o s i t i o na n dc o n s t r u c t i o n ,w a v e l e ta n df i l t e r g r o u p i nt h e t h i r dc h a p t e r , e z wc o d i n ga n dr o ic o d i n ga r ei n t r o d u c e d h o wt oi m p l e m e n t r o ic o d i n gi nt h ea l g o r i t h mf r a m e w o r ko fe m b e d d e dz e r ow a v e l e tc o d i n gi s d i s c u s s e di n t h i s p a r t i nt h ef o u r t hc h a p t e r ,t h ep r o c e d u r ea n d m e t h o do f c o m p r e s s i n gp e r s o n a li d e n t i t yp i c t u r ei se x p l a i n e di nd e t a i l ,a n dt h ee x p e r i m e n t a l r e s u l ti s g i v e n t h a tp a r t i n c l u d e s :t h ew h o l ed e s i g n a t i o no fc o m p r e s s i o n a l g o r i t h m ,s e g m e n t o fr o i ,i m p l e m e n t a t i o no fw a v e l e t st r a n s f o r m a t i o n , s i l h o u e t t e sc o d i n ga n de x p e r i m e n t a lr e s u l t i nt h ef i n a lc h a p t e r , a l lt h er e s e a r c h w o r ki n t h i s p a p e ri ss u m m a r i z e dw i t hap r o s p e c ta b o u tf u t u r e sr e s e a r c h i n g d j r e c t j o n k e yw o r d s :i m a g ep r o c e s s i n g ;c o m p r e s s i o no fi d e n t i f i e dp i c t u r e ;e m b e d d e d z e r ow a v e l e t ( e z w ) c o d i n g ;r e g i o no fi n t e r e s t ( r o i ) c o d i n g 武汉理工大学硕士学位论文 第1 章引言 伴随着通信、计算机、遥感和航空航天等技术的全面发展,人类社会已 进入了信息化的时代。信息社会的一个重要特征就是信息的海量化,无穷的 信息使得人们生活在一个离不开“压缩”的世界里。图像压缩是图像信息处 理的重要手段和分支,它的研究和发展推动了图像信息的存储和传输水平。 图像压缩对于人们的日常生产、生活和科学进步有着十分重要的意义,如果 没有图像压缩技术的发展,今天许多应用都是可望而不可及的。从日常生活 中的数字化的音、视频娱乐,到卫星遥感的海量图像数据传输,再到类似如 火星探测之类的深空探测中的图像信号的传输,都离不开图像压缩技术。时 到今日,图像压缩仍是当前国内外比较活跃的科学研究领域之一。 1 1 图像压缩概述 11 1 信息的定义和度量 图像从本质上来讲是一种视觉的信息。对于信息的定义有很多,作为术 语信息的意义通常指的是客观存在的各个事物状态的表露,以及各个事物 随时间所发生的变化的反映。信息论是应用近代数理统计方法来研究信息传 输和处理的科学。信息论的建立始于1 9 4 8 年美国工程师c e s h a n n o n 研究通 信系统时所发表的论文通信的数学理论,这是一篇关于现代信息论的开创 性权威论文,文中讨论了信源和信道特性,给出了信息度量的数学公式,为 信息论奠定了理论基础。 根据信息的理论,信息是事物发展的不确定性的变化。即人们对某一事 物先后两次认识的差别,或某人对菜一事物获得了新的知识、新的信息。清 华大学的常炯院士认为信息的来源有两方面:1 ) 只有变化着的事物才有信 息:2 ) 只有尚未确定的事物才有信息。归纳而言:信息是指对某一事物的新 知识、新认识。 信息的本质是事物的不确定性的变化,信息的定量表征必然联系着不确 武汉理工大学硕士学位论文 定性的度量。根据概率论,事件的不确定程度,可以用其出现的概率来描述, 事件出现的可能性越小,则概率就越小,反之,则概率就越大。消息中的信 息量与消息发生的概率紧密相关,消息出现的概率越小,则消息中包含的信 息量就越大。 令s 代表 一组事件巨,邑,e 。,它们出现的概率分别为 p ( e r ) = p k ,0 p f l ,并有 p l + p 2 + + p 。= 1 定义11 事件取的自信息记作i ( e 。) ,并定义为 i ( e r ) = 一l o g p f( 1 1 ) 在这个定义中,对数的底没有指明,选择什么样的底实际上无关紧要, 因为底的改变仅仅变动了计量的尺度一一单位。最常见的底是2 和e ,当底选 为2 时,的单位为比特( b i t s ) ,当底选为e 时,是以纳特( n a t s ) 为度量。 p 。愈小则z ( e 。) 愈大,这是和我们的感觉相符合的。某一事件越罕见, 则其出现所带来的信息就越多。 定义12s 的熵,称为h ( s ) ,是自信息的统计平均值,即 日( s ) e u ) p 。l o g p 。 ( 1 _ 2 ) 因为p 。可阻为零,使得定义中的p 。l o g p 。成为不定式,所以当p k = 0 时, 指定p 。l o g p 。等于零。一个事件的自信息是随其不确定程度的增长而加大 的。所以熵可被认为是系统不确定程度的度量。当所有事件具有等概率时, 事件将在某一时间出现的不确定性为最大,这时候日( s ) 亦最大,而对确定事 件而言,h ( s 1 为零。 1 1 2 图像压缩原理 一般说来,自然界的数据或多或少都含有冗余,数据压缩的目的就是把 这些水分挤掉,用最少的比特表示最多的信息。比如我们日常说的话,百分 之七十以上都是多余的。通过一种运算,把这些多余的东西剔除出去,就 实现了数据压缩。典型的数据压缩包含去相关( 冗余) 和熵编码两个步骤。 武汉理工大学硕士学位论文 实际上日常生活中拍发电报的过程就是一个数据压缩的经典范例。为了减少 电报的字数,我们把文字尽量精简,浓缩为一种类似文言文的精炼文字,表 达的意思保持不变;然后将精简后的文字转换为莫尔斯电报码发送出去。这 两个步骤分别相当于数据压缩的去相关和熵编码。 尽管数据压缩的实践很早以来就广泛存在于人们生活当中,科学上对数 据压缩的研究却始于1 9 4 8 年。针对通信的信源编码问题,s h a n p , o n 发表了通 信的数学理论。在这篇文章里,作者从概率统计的角度详细讨论了输出信元 为n ( n = o ,l ,2 ,3 ) 阶平稳有限马尔科夫链时的无损压缩问题,并从理论上证明, 信号的无损压缩倍率不可能高于信号的熵。在此基础上,1 9 5 2 年h u f f m a n 提 出了以他的名字命名的编码算法,解决了一阶马尔科夫序列的无损压缩问题。 1 9 6 3 年p e t e re l i a s 提出了比哈夫曼码更优的算术编码,但是第一个实际可用 的算法直到1 9 7 6 年才由r i s s a n e n 和p a s c o 给出。1 9 7 7 年z i v 等人基于字串 复杂度分析,设计通用信源的l e m p e l z i v 编码得到了和s h a n n o n 的熵编码相 同的结果。此后,熵编码成为了各种数据压缩技术的基础。从信息论的角度 看来,数据压缩的问题转化为如何将高阶马尔科夫序列转化为一阶序列的问 题 引。 图像可以表示成确定性信号、随机信号和噪声的混合 4 l 。设图像信号为 f ( x ,力,则 f ( x ,y ) = e ( x ,y ) + 只( x ,y ) + ( 仃,卢) ( 1 3 ) 其中兀( x ;y ) 为确定性信号;c ( z ,y ) 为马尔科夫随机信号;( 盯,) 为高斯噪 声。针对上述图像的混合模型,图像压缩算法应该包含以下基本步骤:1 ) 信 号逼近;2 ) 信号去噪;3 ) 熵编码。信号逼近的目的在于去除只( x ,j ,) 的高度 相关。这时图像信号被当作一个二维函数形成的曲面( 以灰度为z 方向坐标) , f 阮v ) 和( 仃,口) 被近似看成是信号的高频成分。这种情况下,去相关的本 质是二维曲面的分解与逼近,常用的方法有付立叶分析或小波分析。通过某 种正交变换可以极大的去除图像信号的相关;信号去噪是为了降低数据的熵 值;噪声信号一般具有很高的熵值,混合在有效信号中对压缩编码的整体效 率有很大影响,必须在熵编码之前剔除出去;经过上述处理以后,图像信号 转化为一系列随机信号,可进一步采用熵编码进行压缩1 5 “。 综上所述,图像压缩的基本原理如图1 1 示,包含以下几个部分:去相 武汉理工大学硕士学位论文 关、量化和熵编码。首先将图像当作确定性信号处理,采用d f t 、d c t ( 其 实质仍为付立叶分析) 、d w t 变换等函数逼近的方法降低信号的相关性;然 后对变换的系数进行量化处理,以去除信号的噪声,降低系数熵值;最后, 采用信息论提供的方法进一步去除数据的冗余。 f 图壁 t 系数预测 d c t 变换 d w r 变换 标量量化 矢量量化 游程编码 霍夫曼码 算术编码 图1 - 1图像压缩的原理框图 1 2 身份照片的压缩 1 。2 1 身份照片压缩的需要 压缩数据 身份照片压缩主要源于身份管理系统的升级换代的需要。传统的各类身 份证件的文字或图像直接打印在证件表面。在长期的使用过程中出现了不少 弊端。首先,受证件尺寸限制,所记载的信息量少;第二,信息的保密性差, 由于信息直接印在证件表面,所有的信息对证件的阅读者是公开的。第三, 易于仿造,因此安全性较差。第四,信息更改不方便。为克服上述的各种弊 端,在9 0 年代中后期,出现了新一代的信息存储式的身份证件,最有代表性 的就是条形码和i c 卡证件。这种信息存储式证件与第一代证件最大的不同之 处在于,它可以在证件上的条形码或i c 卡中存储更多的个人信息,比如:照 片,个人文本资料,指纹等。即,除直接可见目视信息外,还携带有大量的 机读信息。这就大大增强了证件的防伪、安全等性能。对i c 卡证件而言,芯 片中存储的内容可以随时更改,而不必更换证件。鉴于上述的优点,目前许 多国家都开始普及和使用第二代存储式证件( 如,条形码或i c 卡护照、身份 武汉理工大学硕士学位论文 证、暂住证、军人证等) 。我国即将换发的第二代身份证就是非接触式i c 卡 身份证。 照片是个人身份最为直观的确认信息,所以一直是各种证件必须携带的 重要信息之一。但是在实际应用中,无论是条形码还是i c 卡中的存储芯片, 存储空间都是非常宝贵或者有限的。p d f 4 1 7 二维条形码由美国s y m b o l 公司 1 9 9 1 年正式推出,简称为p d f 4 1 7 条码,目前已成为通用的国际标准。它的 最大容量参数为:可容纳1 8 5 0 个大写字母或2 7 1 0 个数字或1 1 0 8 个字节。一 维条形码容量更小。一维和二维条形码如图l 一2 所示。 圳删 图l 一2+ 维和p d f 4 1 7 二维条形码 i c 卡的信息容量受卡上芯片内部的存储器容量大小的限制,虽然可以做 得很大,但成本也会相应的提高。然而,最小的身份照片( 1 寸的黑白照片) 一般都在7 0 0 0 字节以上,彩色或尺寸稍大的所占空间就更大了。因此,要想 在条形码或i c 卡中存储个人身份照片,并且做到成本合理,就必须对身份照 片进行压缩。 1 2 2 身份照片压缩技术的国内外动向及水平 自二个世纪9 0 年代中后期,出于信息存储式证件的需要,人们开始研究 针对身份照片的压缩算法。到目前为止,比较成熟的算法是基于矢量量化的 f c 2 v q ( f e a t u r ec o r r e c t i o nt w o s t a g ev e c t o rq u a n t i z a t i o n ) 算法。 f c 2 v q 算法由纽约理工大学的h u 等人 1 在1 9 9 6 年提出,并成功实现 了对黑白身份照片的压缩。该算法的主要思想是首先矢量量化整幅照片并同 时把人脸的主要特征区域( 眼睛和嘴所在的区域) 检测出来,然后对这块区 域的差图再进行矢量量化 8 j 以便细化该区域,最后进行h u f f m a n 编码。f c 2 v q 算法能把一张1 2 8 1 2 8 像素的黑白照片平均压缩到大约3 5 0 字节,而质量仍 可接受( 基本上不影响人眼辨认) 。在1 9 9 9 年,纽约理工大学h u a n g 等人又 武汉理工大学硕士学位论文 利用f c 2 v q 算法完成了彩色照片的压缩。他们把f c 2 v q 算法推广到多种彩 色空间,如r g b ,y b c b c r 等。他们的实验表明,一张1 2 8 1 2 8 像素的彩色 照片平均压缩到大约5 0 0 字节,质量可以接受。 在这之后,国内出现了改进的f c 2 v q 算法【9 】一一混合压缩算法。该算法 将面部特征区( r o f f ) 用小波零树编码进行压缩,其余部分仍然采用f c 2 v q 算法进行压缩。该算法能够将9 6 1 2 8 像素的彩色照片压缩到5 0 0 6 0 0 字节 之阃,取得比较好的视觉效果。 可以看出,目前对身份照片的压缩主要采用的是矢量量化的方法。但矢 量量化无法准确预汁和控制编码的长度。而在实际应用中,证件中存储的信 息除身份照片以外还有其它一些信息,一般包括一至两枚指纹数据和相关的 个人信息,如证件号码、姓名、性别、籍贯、民族、地址和发证机关等等。 这些信息对于不同的人,大小通常是不一样的。如果采用基于上述矢量量化 的方法对身份照片进行压缩的话,目标编码的长度必须在考虑各种情况的基 础上取一个最小的允许长度,才不至于在实际应用中出现其它信息容纳不f 的情况。这样一来,必定有许多证件上有多余空间存在,这部分空问没有发 挥作用,造成了存储空间的浪费。 为了解决这一实际应用中的不足,上述的混合算法由郭【9 j 等人提了出来。 该算法利用了嵌入式小波零树编码【10 】的目标编码长度精确可控的特点,使卡 上存储空间可以得到完全的利用。但该算法比较复杂,既需要矢量量化,又 需要进行嵌入式零树编码,增加了系统的计算量和实现的难度。那么是否可 以只用小波编码达到较为理想的压缩效果呢,这是本文研究的主要问题。 1 3 论文的研究背景、任务和结构 131 论文研究的背景、目的和意义 本论文的研究工作依托于武汉理工大学科研基金项目“面向对象的小波 变换图像压缩编码算法研究”。 文中以1 寸左右的普通黑自身份照片( 6 9 9 4p i x e l ,8 b i t ,7 6 6 0 字节左 右) 作为压缩对象。以嵌入式小波零树编码作为主要的压缩方法。同时,为 兼顾压缩比和压缩质量,引入r o i 编码技术。在压缩质量可以接受的情况 武汉理工大学硕士学位论文 下,使压缩后的照片所占空间至少小于5 0 0 字节( 压缩比大于1 5 ) 。 本文研究工作有两个方面的意义。第一,从具体的应用角度看,本文研 究成果可以直接应用于身份照片的二维条形码或i c 卡存储。第二,从图像压 缩和编码的角度看,本文对感兴趣区域编码在身份照片压缩中的效果的研究 有助对其他科研工作者,或从事图像压缩技术开发人员直观地看到感兴趣区 域编码在具体应用中所发挥的良好作用。 1 32 技术路线和研究任务 本文对身份照片压缩的主要的技术路线如图1 3 所示。 身 份 昭 片 r r一1 一脸部特征区检测r 叫小波零树编码 - h熵编码 1 一一 图1 3身份照片压缩的主要技术路线 为了实现上述技术路线指导下的身份照片压缩,本文的主要研究工作包 括以下几个方面: 1 ) 研究了图像压缩的基本原理、主要算法和标准。同时,为准确的对面 部感兴趣区域进行分割,还对有关图像分割和人脸检测方面的论文和著作进 行了研究。 2 ) 研究了基本的小波理论和嵌入式小波零树编码算法,并在零树编码的 框架内实现了基于位面移位的感兴趣区域编码。 3 ) 对现有的感兴趣区域编码算法作了系统的研究。感兴趣区域编码源于 实际的图像、视频工程应用,主要是为了解决低比特率图像编码时的视觉质 量问题。本文通过引入感兴趣区域编码来提高身份照片的整体压缩质量( 在 定的压缩比或目标比特率下) 。 4 ) 用v c + + 6 0 实现了本文的压缩算法,并能得出主要压缩的性能参数 ( 所有压缩参数可以e x c e l 的格式导出,便于分析) 。 武汉理工大学硕士学位论文 1 3 3 主要内容与结构 本章介绍了本文选题的背景和意义,阐述图像压缩的基本原理,身份照 片压缩的需求和国内外的身份照片压缩的研究现状及存在的不足。在此基础 上提出了本文的研究目标,并简要的介绍了研究的主要任务、技术路线和内 容。 在第二章对本文压缩算法的理论基础一小波变换理论作了简洁而重点突 出的介绍,包括小波变换的基本定义、多分辨率分析、小波变换的m a l l a t 算 法、信号的小波分解与重构和二维小波变换。 第三章中介绍了本文算法的两个重要基础一嵌入式小波零树编码和感兴 趣区域编码。并在这一章的开始部分,对基于小波的图像编码做了简要而系 统的介绍。 第四章详细的阐述了本文算法的设计和实现,并给出了实验结果及其分 析。这一章的开始,给出了本文算法的总体设计思路、本文对身份照片区域 的i 层次划分( 根据所包含人脸识别信息量的多少) 以及在此基础之上的相 应处理。随后的几节中对算法实现中的几个主要也是必须解决的问题一一作 了阐述,它们是面部感兴趣区域的定义和分割、头肩区域的分割、小波变换 的实现( 小波基的选取,边界问题,分解和重构的实现) 以及头肩轮廓的编 码。在最后一节中给出了实验结果及其分析。 第五章对全文的工作进行了总结,给出研究的结论,并对今后的研究方 向进行了展望。 武汉理工大学硕士学位论文 第2 章小波变换的基本原理简介 小波理论是8 0 年代迅速发展起来的应用数学分支。1 9 8 0 年法国地球物 理学家m o r l e t 仔细研究了g a b o r 变换,对f o u r i e r 变换和短时f o u r i e r 变换做 r 深入研究,创造性地提出“小波”的概念,并建立了以其名字命名的m o r l e t 小波,该方法在地质数据处理中取得了巨大的成功【1 “。小波的基本思想是通 过一个母函数在时间上的平移和尺度上的伸缩,获得一种能自动适应各种频 率成分的有效的信号分析手段,以取代短时f o u r i e r 变换。在分析非平稳时变 信号时,既能用持续时间很短的高频基函数去分析信号的高频成分,又能用 持续时间相对较长的低频基函数去分析信号的低频成分。小波变换在时域、 频域内具有良好的局部分析特性,在信号分析、图像处理、数据压缩、计算 机视觉等很多领域得到了广泛的应用1 2 【1 3 l 1 ”。 2 1 连续和离散小波变换 小波变换与f o u r i e r 变换非常相似,其基本的数学思想来源于经典的调和 分析,都是将信号与一个具有两个参数的函数族作内积运算。f o u r i e r 变换以 三角函数作为基底对信号进行展开,小波变换则以局部化函数所形成的相似 函数作为基底对信号进行展开。小波变换发展了短时f o u r i e r 变换的局部化思 想,其窗口可随频率增大而缩小,随频率减小而放大 1 5 。 连续小波变换的定义【1 6 】 1 7 】【18 l 【1 9 为 :一 ( 矿,倒,6 ) :”r 。厂( f ) ( 旦) 出 ( 2 1 ) ” “ 其中y ( f ) 称为基本小波,口称为尺度因子,6 称为平移因子。参数日和b 均 连续变化,故称之为连续小波变换。连续小波变换也可以用内积的形式表示 为 ( 厂) ( 口,b ) = ( 2 2 ) 其中吵。( f ) 为基本小波的伸缩与平移,参数a 的变化对小波窗函数的形状 和频谱结构起着决定作用。当d 减小时,y 。( f ) 的频谱集中于高频部分,窗 武汉理工大学硕士学位论支 口的尺寸也小,这时候的小波函数具有较好的空间分辨率;当a 增大时, y 。( f ) 的频谱又向低频部分倾斜,窗口的尺寸增大,空间分辨率也随之降低。 小波变换所采用的小波函数必须满足“容许条件”式( 2 3 ) ,小波变换才 存在逆变换。小波变换的容许条件为 旷警, 其中p 白) = 广e 一o 协 ( 2 3 ) 容许条件表明:能用作基本小波的函数妒0 ) 必须满足驴妇= 0 ) = 0 的条件, 即y 0 ) 为均值为零的振荡波形,痧如) 具有带通性质。 当:| _ :监笔l 珊 l ,b o 0 是固定值, 则连续小波变换转化为离散小波变换。特殊的,若a 。= 2 ,b 。= 1 ,则称其为二 进离散小波变换。 2 2 多分辨率分析 多分辨率分析从函数空间的角度建立不同尺度空间的关系,在上2 ( r ) 空 间内函数被分解为一系列近似函数的极限。每一个近似都是原函数的逼近, 并且逼近的程度越来越高。m a l l a t 首先将多分辨率分析的方法引入小波理论, 并给出了以其名字命名的二进离散正交小波变换的快速算法。多分辨率分析 和滤波器组的设计相结合,使得小波变换具有实际的意义。多分辨分析定义 武汉理工大学硕士学位论文 为如下。 l 2 ( r ) 空间的序列 ) ,z ,构成一个二进多分辨率分析,如果 _ 满 足以下条件【2 0 】 2 1 】 2 2 】: 。 ( 1 ) 是一个嵌套序列,即3 旷。 k3 ( 2 ) 所有_ 的并在l 2 ( r ) 中是稠密的,即c l o s l 2 ( i o ( u ) = r ( r ) j e z ( 3 ) 所有_ 的交是零函数,即n = o r z ( 4 ) 厂( r ) 一f ( 2 t ) 一1 对( 2 。f ) v o ,z ( 5 ) ( f ) 一f ( t 一2 ) 略,女z ( 6 ) 存在妒o ) v o ,使得。( f ) = 伊0 一七) 构成v o 中的一个标准正交基。 性质( 2 ) 确保了在无限高分辨率下对信号的逼近收敛于原始信号( 假设 原始信号具有无限高分辨率) ,即 l i m f = f( 对纸奄f l 2 ( 秘) h 一 具有性质( 1 ) ( 3 ) 的嵌套子空间序列有很多,但其中许多子空间并 不是多分辨率分析。要成为多分辨率分析,还必须满足性质( 4 ) 的要求,即 所有的子空间( z ) 都是主要子空间( 或称为参考子空间) 在不同尺度 下尺度变换的结果,这正是“多分辨率分析”的体现。 性质( 1 ) 隐含着这样的意思,即信号f ( t ) 宅z e 一一,上的正交投影0 f 含有 它在v 上正交投影的全部信息,即 p f = p ,j 7 + f ,i f ,悼妒堆 k 式中, | 】f ,肚是一 ,比o f 多的信息。它可以用小波y ,。的线性 组合表示,其系数等于信号关于小波的连续小波变在确定的和不周的七 上的取值,即为小波级数的一组系数值。由于p ( r ) 在中,而圪包含于旷,中, 武汉理工大学硕士学位论文 即k ,且矿l 。( r ) = x 2 o ( 2 t 一女) 是旷。的一个标准正交基,故妒( r ) 可用此标 准正交基表示为 妒( f ) ;h k f p - i , k ( f ) = 2 吮q o ( 2 t t ) ( 2 - 5 ) 这就是函数p ( f ) 的两尺度关系,序列 h 。) 称为两尺度序列,也是滤波器系 数。它把两个不同尺度的尺度函数妒( f ) 和f p ( 2 t ) 联系起来。 对于妒( f ) 生成的多分辨率分析 y ,) ,由于 e ,设为关于矿,的 补空间,即: n 岷= ( o ) ,k ,= + 由于y ( x ) c k ,所以存在序列 g 一使得: y ( x ) = 压g ,o ( 2 t 一,) ( 2 6 ) 上式是y ( r ) 关于p ( f ) 的两尺度关系, g ,) 是相应的两尺度序列。 2 3 小波变换的m a | ia t 算法 y ( f ) 关于妒( f ) 的两尺度关系式提供了一条由尺度函数妒 心) 构造母小波 妒( r ) 的途径1 2 3 2 4 】: 矿( r ) = g f ( f ) ( 2 - 7 ) 由妒。( ,) 的定义式得到 妒- 1 , 1 ( f ) = 2 1 2 妒( 2 f 一,) ( 2 8 ) 将式( 2 - 7 ) 代入小波妒“( f ) 的定义式,得 g j , k ( f ) = 2 - 2 g f 妒扎胆一。卜k ) , 将式( 2 - 8 ) 代入上式,有 ( f ) = 2 - ( s - 1 ) , , 2 g ,缈( 2 1 卜2 k 一,) , = g f 妒川m + ( r ) 武汉理工大学硕士学位论文 削,取代2 女+ f ,上式成为 ( f ) = g 。9 j - l j ( f ) ( 2 9 ) , 计算厂( ,) l 2 ( r ) 与上式两端的内积,便得到如下计算小波级数系数的一个公 式: c 肚; = 西 = 蚕。d 川 ( 2 1 0 ) f, 式中,d 川j = 是信号厂( ,) 与p ,) 的内积,一般情况下表示为 d ,= ( 2 - 1 1 ) 由于”,) 是子空间_ 的标准正交基,故信号在上的正交投影哆厂( f ) 或厂。( f ) 可以用,和伊川( f ) 表示如下: 厂w ) ;p v ,f ( t ) = d j , i g j , l ( ,) ( 2 一1 2 ) , 在数学上,f ) 是平方可积连续函数,它是l 2 ( r ) 的元素:d 川( ,z ) 是 平方可和序列,它是平方可和序列矢量空间,2 ( z ) 中的元素。式说明。( r ) 与 d :s ( f z ) 有等效对应关系,在数学上称1 2 ( z ) 与三2 ( 月) 之间存在着同构关系。 显然,d 比厂( r ) 更适合于在计算机上运算。d ,f 称为在分辨率2 。下厂( r ) 的 离散逼近。 式( 2 - 1 0 ) 的计算过程是:先计算序列d s 。,( ,z ) 与豇,的卷积,然后抽 取偶数下标( 隔1 抽1 ) 的卷积结果,即得到小波级数的系数c 。( 七z ) 。 值得注意的是,在分辨率2 。下对信号,( r ) 的离散逼近d 。( ,z ) ,可以用 塔式算法来计算。这是一种迭代计算方法,推导如下。 将两尺度关系式代入妒似( r ) 的定义式,有 妒m o ) = 2 - j , , 2 妒( 2 一f 一女) = 2 - ( s - o 2 f 妒 2 ( 2 一。f - k ) - t 武汉理工大学硕士学位论文 = h ,m + f ( f ) = 。、) ( 2 1 3 ) ,f 由此可以计算厂( r ) 与吼,。( f ) 的内积,即 d j ,。- - - - :厂,妒,。,= 瓦一:。c 厂,妒, ,= 五一:。d ,吐, ( 2 一1 4 ) 将式( 2 - 1 0 ) 和( 2 - 1 4 ) 结合起来,便得到一种计算小波级数系数的快速算 法,其过程为:由d 。开始,利用式( 2 1 5 ) 进行迭代运算( 当然应当已知序 列h 一,) ,陆续计算出d 、d 。,。等等;与此同时,利用d 。pd 耻、d 。,。等值, 由式( 2 - 1 0 ) 不断计算出c 、c :。等小波级数系数值( 当然臣,应该是己知 的) 。 一方面,计算信号在越来越低的分辨率下的逼近d 灿:另一方面,r a 时 也计算出相邻两次逼近d 川,。与d 肚2 :i n 的信息差c 卅。 实际中,任何测量仪器的精度或分辨率都是有限的。为不失一般性,可 假设原始信号是在臼= 1 或7 = 0 的分辨率下测得的,用f ( t ) 或,o ( f ) 表示,它 属于子空间。在2 2 节中曾讨论过,子空间v o 可分解成互相正交的两个子 空间,表示为 圪= ko w i ,_ c 且k 上暇 k 又可做同样分解,即 u = o ,ck 且kj _ 照此不断分解下去,直到某一很耦的分辨率2 。,于是得到 v o = 巧o o 矿, ( 2 - 15 ) j = l 根据该式,原始信号厂o ( r ) 具有下列唯一分解 厂o ( f ) = 厂。( r ) + 占) ( 2 1 6 ) j ;1 式中,厂。( r ) 是信号f ( t ) 在子空间p j 上的正交投影或在分辨率2 。下的逼近, 它由下式确定 墨望堡三奎堂婴主堂篁堡苎 一一 ,。( r ) = d 川妒 u ) 占是信号在缈( = l 一2 ,j ) 各子空间上的正交投影,它们是从一个较精确 的逼近变成较粗略的逼近( 两个逼近的分辨率相邻近) 时所丢失的信息,由 下式确定 ( f ) = c m ( r ) ( 2 1 7 ) 这一不断降低逼近分辨率的过程可以比喻成是“一层又一层的把信号进行剥 皮,的过程。当选得足够大时,“剥”下来的信息总和( r ) 足够多,将足 以精确表示原始信号f o ( r ) ,而最终的逼近信号厂。( f ) 的分辨率已经非常低, 这样反而可以把j ( r ) 当成原始信号的估计,而把厂。o ) 看成是估计误差。 这就是说,用小波级数在所有分辨率下的全部系数( _ ,= 1 ,2 ,l ,) 来代替

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论