(电路与系统专业论文)基于小波变换的图像检索技术研究[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)基于小波变换的图像检索技术研究[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)基于小波变换的图像检索技术研究[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)基于小波变换的图像检索技术研究[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)基于小波变换的图像检索技术研究[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西北大学硕士学位论文 摘要 图像检索是多媒体应用的关键技术,特别是基于压缩域图像检索技术,由于 处理的数据量少,减少了对计算机资源的需求,提高了系统的实时性、高效性和 灵活性,对多媒体业务的普及和拓展以及多媒体网络的繁荣起着积极地推动作 用。因此基于内容的压缩域图像检索有着重要的理论意义和应用价值,是当前图 像检索的热点和趋势。本文对基于压缩域的图像检索进行了研究,主要工作如下: ( 1 ) 系统地论述了压缩域图像检索技术的发展现状,总结了图像检索的一 些关键技术。 ( 2 ) 在对子带小波系数分布的统计特性进行分析的基础上,研究了基于广 义高斯分布的小波域图像检索方法,实验发现:对于系数动态范围大而峰值又尖 锐的图像,广义高斯分布不能够很好地描述这种小波系数的分布,这会影响到图 像检索的效果。由于高斯混合模型具有一个重要特性:如果模型中的成员足够多, 就可以任意精度地逼近任意的连续分布。因此本文提出改用高斯混合模型来拟台 子带小波系数的分布。实验显示,混合模型对小波系数分布的拟合效果比广义高 斯分布有明显提高,证明改进的想法是可行的。 ( 3 ) 对基于广义高斯分布的小波域图像检索方法进行改进。采用两个分量 的高斯混合模型拟合小波系数的统计直方图,近似描述系数的分布情况。通过 e m 算法估算出模型的参数,根据高斯混合模型的相似性匹配进行图像的检索。 实验证明,采用高斯混合模型的方法比采用广义高斯分布的方法,检索准确率有 一定的提高。 关键词:基于内容的图像检索:压缩域图像检索技术;小波变换;高斯混合模型 西北大学硕士学位论文 a b s t r a c t t h ec o n t e n t b a s e di m a g er e t r i e v a lt e c h n i q u ep l a y sac r u c i a lr o l ei nm u l t i m e d i a a p p l i c a t i o n t h ec o m p r e s s e dd o m a i nr e t r i e v a lm e t h o d sr e d u c et h en e e do ft h e c o m p u t e r ;i m p r o v et h er e a l t i m eo fc o m p u t e ra n d a g i l i t y t h e s ei m p e l l e dt h e p o p u l a r i z a t i o na n dd e v e l o p i n go fm u l t i m e d i a s ot h ec o n t e n t b a s e di m a g er e t r i e v a l t e c h n i q u e sw e r eu s e dm o r ea n dm o r ep o p u l a ra n dw i d e l y , r e t r i e v a lt e c h n i q u e sb a s e d o nc o m p r e s s e dd o m a i nb e c o m e san e w i m p o r t a n tt r e n do fc b i r i nt h ed i s s e r t a t i o n ,t h ei n v e s t i g a t i o nw o r kh a sb e e nd o n ea r o u n dt e c h n i q u e so f i m a g er e t r i e v a lb a s e do nc o m p r e s s e dd o m a i n t h em a i nc o n t e n ta r ea sf o l l o w s : ( 1 ) a n a l y z e dt h ec o m p r e s s e dd o m a i nr e t r i e v a lm e t h o d sa tp r e s e n t s u m m a r i z e dt h e k e yt e c h n o l o g yi nt h ei m a g er e t r i e v a lt e c h n i q u e ( 2 ) a n a l y z e dt h es t a t i s t i c a la t t r i b u t i o no fw a v e l e tt r a n s f o r m a t i o nc o e f f i c i e n t s 1 1 1 e e x p e r i m e n ts h o w st h a ta ni m a g er e t r i e v a lm e t h o db a s e do nw a v e l e td o m a i nw a s p r o p o s e db yu s i n gg a u s s i a nm i x t u r em o d e lo fw a v e l e tc o e f f i c i e n t sd i s t r i b u t i o n t h ee f f e c to fu s i n gg a u s s i a nm i x t u r em o d e li sb e t t e rt h a ng e n e r a l i z e dg a u s s i a n m o d e l ( 3 ) i m p r o v et h ew a v e l e t - b a s e di m a g er e t r i e v a lw h i c hb a s e do i lg e n e r a l i z e dg a u s s i a n w ed e s c r i b e da p p r o x i m a t e l yt h ec o e f f i c i e n t sd i s t r i b u t i n g b yu s i n gg a u s s i a n m i x t u r em o d e lt of i tw a v e l e tc o e f f i c i e n t sh i s t o g r a m t h ee x p e r i m e n t ss h o wt h a t t h er e t r i e v a le f f e c to fu s i n gg a n s s i a nm i x t u r em o d e li sb e t t e rt h a ng e n e r a l i z e d g a u s s i a nm o d e l k e yw o r d s :c o n t e n t b a s e di m a g er e t r i e v a l ;c o m p r e s s e dd o m a i ni m a g er e t r i e v a l ; w a v e l e tt r a n s f o n n ;g a u s s i a nm i x t u r em o d e l i l 西北大学学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻 读学位期间论文工作的知识产权单位属于西北大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和电子版。本人允许论文被 查阅和借阅。学校可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学 位论文。同时,本人保证,毕业后结合学位论文研究课题再撰写的文 章一律注明作者单位为西北大学。 保密论文待解密后适用本声明。 学位论文作者签名:史照 指导教师签名i 主螽查 6 年6 月1 8 日揶年,月日 西北大学学位论文独倒性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含 为获得西北大学或其它教育机构的学位或证书而使用过的材料。与我 一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意。 学位论文作者名:史堕 扣6 年;月洁日 西北大学硕士学位论文 第一章绪论 本章着重介绍了本论文选题的背景及意义,简要介绍了基于内容的压缩域图 像检索技术及其特点:详细地论述了其发展现状;最后介绍了本论文的研究内容 及论文的结构安排。 1 1 课题的背景及研究意义 随着计算机、数码相机、扫描仪等电子设备的出现,数字图像的获取、处理、 存储和传输等变得非常便利,图像的数量呈现几何级数增长。如何快速、高效的 查询所需要的图像信息成为当前图像研究领域要解决的关键问题之一。 从2 0 世纪9 0 年代开始,基于内容的图像检索( c o n t e n t - b a s e di m a g er e t r i e v a l , c b 双) 技术应运而生并且已有了一定的成果。但是,随着压缩标准( 如j p e g 、 m p e g 、h 2 6 l 、j p e g 2 0 0 0 等) 的制定和推广,现实生活中压缩格式的图像或视 频的使用越来越普遍和广泛,在网络上采用的图像有8 0 以上是压缩格式的。压 缩域图像检索技术( i m a g er e t r i e v a lt e c h n i q u e si nt h ec o m p m s s c dd o m a i n ) 宜接对 压缩数据进行处理,从压缩数据中提取特征用于检索。由于处理的数据量少,减 少了对计算机资源的需求,提高了系统的实时性、高效性和灵活性,对解决信息 膨胀、有效快速地利用多媒体信息有着实际的应用价值,对多媒体业务的普及、 拓展和以及多媒体网络的繁荣起着积极地推动作用,是当前图像检索的热点和趋 势f l 】。 1 2 基于内容的压缩域图像检索技术的简介 1 2 1 基于内容的图像检索技术 基于内容的图像检索有别于传统的图像信息检索。传统图像检索方法常使用 文字标识符,先用文字或数字标签对图像进行描述,然后以标签作为索引进行检 索,将图像查询变成了基于标签的查询。这种方法简单,但是存在一些根本性的 问题。首先,对图像加注标签信息需要手工完成,适用于小的图像集合,但不能 西北大学硕士学位论文 满足大型多媒体信息库的要求,更不能适应大量新资料的出现,这种方法过于费 时费力;其次,对图像进行文字描述是非常主观的,不同的观察者或者同一位观 察者在不同条件下对同一幅图像可能会有不同的理解,因此不够客观,没有统一 的标准。检索出的结果不能很好的符合用户的需求。为解决上述问题,需要全面 地、客观地提取图像的内容。只有根据图像的内容进行检索才能有效地获得所需 的信息,同时在掌握图像内容的基础上,才能更有效地管理数据库中的图像信息。 基于内容的图像检索技术借助对图像从底层到高层进行处理、分析和理解的 过程,获取其内容并且根据内容进行图像检索【2 】,它涉及到计算机视觉、人工智 能、图像处理和数据库等多个领域技术的结合,是一个很有前途的发展方向。其 应用前景包括:数字图书馆、艺术搏物馆、医学分析、专利检索、商标注册管理、 人口户籍管理、档案查询、地图地理信息系统、建筑设计、服装设计等等。 1 2 2 基于压缩域图像检索技术 前文提到的基于内容的图像检索技术,主要是针对直接采集到的原始图像数 据进行的,通过原始像素来获取图像的低层物理特征。对于普遍存在的压缩格式 的图像数据,必须首先解压缩后才能进行相应的分析处理,这严重影响到检索系 统的实时性和灵活性。压缩域图像检索技术也是基于内容的图像检索技术,它与 基于原始数据的图像检索技术最本质的区别是直接对压缩数据进行处理,从压缩 数据中提取特征用于检索。基于像素域( 原始数据域) 和压缩域的图像检索的一 个对比示意如图1 1 所示。 图1 1 压缩域和非压缩域检索对比示意图 基于压缩域的图像检索技术研究实际上是把图像的压缩技术和检索技术融 合在一起,力图实现快速、高效、灵活的图像检索算法,克服现有方法将图像压 缩技术和图像检索技术相隔离所带来的不便,从而避免“全解压”的额外操作, 西北大学硕士学位论文 提高系统的灵活性和有效性。因此基于压缩域的图像检索与传统的基于原始数据 或解压缩域上的图像检索相比,有以下优点: 1 压缩域上的数据量比原始域或解压域上的数据量少,这有利于提高整个 系统的效率,尤其是检索系统要求实时响应的场合; 2 压缩域上的检索可省略( 或部分省略) 解压缩的环节,既可减少处理时间, 也可减少设备开销; 3 许多图像压缩算法在压缩过程中已对图像进行了大量的处理和分析,如 果在检索过程中能利用好这些处理和分析的结果,将能有效地减少计算量,提高 检索效率: 4 基于特征的图像检索方法在存储图像的时候( 建库1 ,除了存储图像外还 要存储相应的特征向量。丽在压缩域上,某些特征向量的信息就包含在压缩系数 中,所以额外的存储量可以省去。 综上所述,基于压缩域图像检索技术由于处理的数据量少,减少了对计算机 资源的需求,提高了系统的实时性、高效性和灵活性。在图像检索系统中,图像 的特征直接在压缩数据中快速提取,特别适合于网络上的应用,对多媒体业务的 普及和拓展以及多媒体网络的繁荣起着积极的推动作用。因此基于内容的压缩域 图像检索有着重要的理论意义和应用价值,是当前图像检索的热点和趋势。 1 3 压缩域图像检索技术的发展现状 图像压缩的技术很多,现在还没有一致的分类。考虑到常用压缩技术的特点 和压缩域检索的要求,可将压缩域检索分为空间域检索和变换域检索两类,如图 1 2 所示。 图1 2 压缩域上图像检索方法的分类 如图1 2 所示,空间域检索的数据可由矢量量化( v q ) 、分形编码或预测编 西北大学硕士学位论文 码获得,而变换域检索的数据可利用k l 变换,离散傅里叶变换( d f t ) ,离散 余弦变换( d c t ) ,离散小波变换( d w t ) 和子带( s u b b a n d ) 编码等得到。 下面根据基于内容的压缩域图像检索的分类,分别对变换域和空间域的检索 发展现状进行简要介绍。 变换域压缩图像的检索 1 、k l 变换 在各种用于压缩的变换中,k l 变换具有最好的能量集中性,是一种统计最 优的变换。k l 变换的基本矩阵是随图像自适应变化的,所以可以通过映射图像 到k l 空间,然后可以通过比较k l t 系数来获得良好的图像的检索性能。 但实际应用中,由于k l t 计算复杂,而且必须存储基本图像,因此很少有 图像真正用k l t 进行压缩,基于k l 变换域的图像检索并不实用。 2 、离散傅立叶变换( d f t ) 傅立叶变换是图像处理领域中的一个重要的数学变换,在图像编码压缩中主 要利用它具有的能量集中性。d f t 被用于图像检索,主要是由于它的以下两个 特性:d f t 系数幅值的平移不变性;d f t 系数可以用来有效地计算图像空域上 的相关性。 s t o n e t l 2 1 等人提出利用d f t 系数幅值计算两个阈值来独立调整匹配的准确性 的方法。其中一个阈值用于调控亮度匹配,另一个用来控制图像纹理的匹配。这 两个阈值可以达到由粗到精的渐进匹配。c e l 锄t a i l o f l 3 】等提出来一种利用d f t 系 数相位分布的图像检索方法。具体为利用一个旋转的向量在1 8 0 度的范围内扫描 d f t 频谱,统计每一个角度的d f t 系数得到一个相位直方图,然后利用这个直 方图进行检索。该直方图具有平移不变性,但在图像发生旋转时,该直方图将发 生循环移位。广泛采用的d f t 系数的特征主要有:最大幅度、平均幅度、幅度 能量和幅度方差等;d f t 系数的径向分布在一定程度上反映了图像纹理的粗糙 度,而d f t 系数的角度分布则反映了图像纹理的方向性。在文献1 4 1 中,作者提 出一种利用傅立叶形状描述算子中的相位进行图像检索的方法,首先对图像的轮 廓点进行傅立叶变换,然后利用某种相位模型进行检索,它对图像平移、旋转和 尺度变换具有不变性。 虽然基于d f t 压缩域的检索技术取得了一定的效果,但是由于d f t 是一种 西北大学硕士学位论文 复数变换,运算量大,实用困难。另外对于一般的图像信号,利用d f t 进行压 缩效果也不很理想,因此很少被用于图像压缩,从而使得基于d f t 压缩域的检 索能力也就无法很好体现。 3 、离散余弦变换( d c t ) 离散余弦变换( d c t ) 作为一种次最佳的正交变换,因其具有的良好解相关 性和快速算法而被国际标准所普遍采用,如j p e g 、m p e g 、h 2 6 l 等。而基于 d c t 域的图像检索技术也取得了多方面的研究成果。其中大部分方法利用了 d c t 系数的特点,如直流( d c ) 系数表达了图像的平均能量,而交流分量( a c ) 则反映了像素间差异的频率信息和方向信息。 s m i t h 等首先提出一种基于d c t 的检索方法【1 5 l 。该算法将图像分成4 4 的 子块进行d c t 变换,每一子块得到1 6 个变换系数。然后对整幅图像计算这1 6 个系数的均值和方差,形成一个具有3 2 维分量的特征矢量来表达图像的纹理特 征。对s m i t h 方法的一种改进是采用与标准兼容的8 x 8 的子块,并且由于后面 的大部分的a c 系数都为零,所以只采用前8 个a c 系数计算其方差用来形成特 征矢量,实现了基于d c t 压缩域的图象纹理特征的提取【1 6 】。这种方法生成的特 征向量维数相对减少,大大降低了匹配复杂度。 研究者们还提出了基于统计特征的检索方法。s h n e i e r 等人提出了一种基于 j p e g 压缩域的图像检索算法【 】,其主要思想是通过判定查询图像和目标图像中 不相连区域对中d c t 系数相似关系的大小进行检索。y u 提出一种可用于直接比 较两幅j p e g 压缩图像相似度的测度:q 测度,可直接利用d c t 系数计算两幅 图像之间的相似程度1 1 8 1 。 考虑到小波变换的优越性,文献【1 9 】提出对j p e g 图像的d c t 系数利用多分 辨率小波变换的形式进行重组,对所有d c t 系数重组得到的若干子带,分别建立 子带能量直方图,而后采用m o r t o n 顺序建立每幅图像的索引,并采用变形b 树结 构组织图像数据库用于图像检索。 4 、小波变换( d w t ) 由于小波变换具有良好的时频局部性、能量高度集中以及与人眼视觉特性相 符的多分辨率分析能力,已被广泛的应用于图像处理领域。近几年的研究表明, 基于小波变换的静止图像压缩系统在性能上优于基于d c t 的压缩系统,使离散 西北大学硕士学位论文 小波变换在j p e g 2 0 0 0 和m p e g - - 4 中获得了应用。目前小波域图像检索技术已 取得了多方面的研究成果。 c h a n g 2 0 1 等人提出了利用各子带能量作为纹理特征进行检索的方法,并与 d c t 、空域方法进行了比较,结果显示小波的纹理特征最具有表现力。j a c o b s 等 人基于小波变换系数的直接比较实现了一种快速的多分辨率图像检索算法1 2 1 1 。先 对图像进行小波变换,对每一图像选出幅值最大的m ( 4 0 6 0 ) 个小波系数,记 录其平均颜色、符号作为索引进行检索。由于特征数据中包含系数的d w t 系数 的位置,所以该算法不具备对平移和旋转等几何变化的鲁棒性。 s m i t h 等人提出了基于小波系数的纹理识别算法瞄l 。该方法先对图像进行三 级小波分解并计算高频子带小波系数的幅度值,所有系数子带通过上采样恢复到 与原图像同样的尺寸,这样共得到9 个纹理通道,所有通道中位置相同的点构成 一个9 维向量,对m x n 大小的图像,将得到m n 个9 维向量。对每一向量中 的分量进行二值化处理,处理后的向量共有5 1 2 种可能值,从而可构建5 1 2 缀统 计宣方图,并用该直方图作为纹理特征来进行图像的检索。虽然这种方法具有较 好的检索性能,但是计算复杂度较高。m a n d a l 等人在此基础上提出了一种改进 的快速小波直方图检索方法j ,在基本不影响检索性能的情况下,大大降低了计 算复杂度。这一类方法统称为小波直方图法,是d w t 压缩域的典型算法之一, 不但对纹理图像具有较好的检索效果,而且对于自然图像也很有效。 s u n 等人证明了任何一种对称小波都可以作为边缘检测算子来实现图像的 边缘检测f 2 4 】,只是采用反对称小波基时,检测出来的边缘图像会产生半个像素的 平移。这样为d w t 域基于边缘轮廓的图像检索奠定了基础。魏海提出了一种基 于反对称双正交小波的图像检索方法【2 5 1 ,它主要是对图像进行反对称正交变换, 利用多尺度边缘去计算边缘像素的方向梯度相角直方图以支持检索,具有较强的 光照变化鲁棒性。文献【2 6 】也实现了种基于小波和不变矩的形状检索方法,它 主要是求多尺度的边界图像,分别计算每一边界图像的7 个不变矩形成特征矢量 并归一化,以此进行形状检索,具有较好的平移、尺度和旋转不变性。 与基于小波子带能量的方法不同,m a n d a l 等人把小波分解的方向子带统计 直方图特征用于图像检索【2 7 1 。他们认为对原始图像而言,不同图像可能具有相同 的统计直方图特性,但不同图像小波分解方向子带的统计特征不可能完全相同。 6 西北大学硕士学位论文 然而直接进行所有小波分解子带直方图的比较计算复杂度过高,采用直方图的矩 特征能大大降低特征数据量。因此他们构造了不同子带的矩特征用于支持小波域 的图像检索。g r a z i a 等人提出了一种用各予带之间的相关性进行图像检索的方法 2 8 1 。首先对图像进行小波分解,分别用各级的l l 子带,l l + h l 子带,l l + l h 子带,l l 十h h 子带近似重构上一级分辨率图像,并计算它们与用全部子带精 确重构的图像之间的相关性,在每一层形成具有4 个分量的特征矢量,用来进行 图像检索。 c h e n 和k t m d u 2 9 1 利用小波和隐马尔科夫模型提出了具有旋转和灰度不变的 纹理图像分类技术。首先从小波的各子带中提取灰度不变的特征,然后利用各子 带序列组成的m a r k o v 模型寻找旋转的变化趋势,这样做到纹理匹配的灰度和旋 转不变性。 空域压缩图像的检索 由于空域压缩格式的图像并没有广泛应用,对空域压缩图像的检索研究远没 有变换域的深入,这里介绍两种。 1 、矢量量化( v q ) 矢量量化( v q ) 是一种映射的方法,其主要思想是借助训练集合构造一个 有限向量个数的码书( 称v q 码书或v q 表) ,然后对任意输入图像中的每一个 分块向量都按一定的距离准则进行分类,把这些向量都采用码书中与之相匹配的 特征向量码字进行表征,而与所有分块向量相匹配的码字的标签序列就是最终的 压缩数据。由此可见,这种方法具有天然的图像检索能力,它的码字在定程度 上与图像的内容相对应,可以用这些码字作为图像的特征。 在压缩域图像检索中,一些文章已经采用了v q 技术。i d r i s 等 3 0 l 通过构造 特征向量集合中各向量使用频数的统计直方图,将其作为表征图像内容的特征用 于实现直接使用向量量化压缩数据进行图像检索。在图像量化中往往选择一个能 最小化矢量量化误差的码本,因为码本和图像的匹配误差程度是由矢量量化误差 决定的,文献f 3 l 】提出可以用这个误差作为检索的距离量度。 若根据图像中矢量的特性,首先进行矢量分类,不同类矢量对应不同的码本。 矢量量化时根据矢量的类型到相应的码本中寻找其码字索引,这种矢量量化称为 分类矢量量化。基于分类矢量量化的检索方法与基于矢量量化类似,不同之处仅 西北大学硕士学位论文 在于分别统计各类码本中码字矢量使用频数的统计直方图,然后把他们连成一个 统一的直方图。基于分类矢量量化进行检索有一个优点:可以根据人眼对各类矢 量的敏感程度,对直方图中的分量采用不同的权值来提高检索效率。魏海【3 2 】等比 较了标量量化( s q ) 、矢量量化( v q ) 和分类矢量量化( c v q ) 用于图像检索 的性能。实验结果表明,基于分类矢量量化的图像检索能够获得很好的性能,充 分利用分类矢量量化的特点实现支持检索的图像压缩算法值得深入研究。 小波变换与矢量量化也常常结合,文献 3 3 】则提出一种结合g a b o r 小波滤波 器的进行特征提取方法。近年来,一种基于高斯混合v q ( g m v q ) 的图像检索 方法被提出3 4 1 ,即用g m v q 的方法得到直方图分量,然后用直方图进行检索。 2 、分形编码 迭代分形编码作为一种高效的图像压缩方法引起了广泛的关注。图像经迭代 分形编码后,形成的分形码中所包含的迭代函数系统以一种紧凑的形式唯一表征 了原始图像,因此可利用迭代函数系统的某些特性实现基于迭代分形压缩数据的 图像检索操作。 z h a n g 等人最早提出一种直接利用图像的分形码来实现基于纹理的图像检 索技术【3 5 1 ,这里分形码是以图像子块为单位得到的,即先把图像分成不重叠的若 干子块,对每一予块根据分形原理寻找其分形码。检索时直接比较查询图像和目 标图像的分形码。 王志勇等人【3 6 】提出了一种基于块限制的分形编码算法和匹配策略,并将它们 用于图像检索。在编码算法中,图像会被预先分成互相不重叠的子图像块,然后 对这些子图像进行独立地分形编码,从而获得整幅图像的分形码。在进行图像间 相似性的匹配时,采用改进的基于九又树的分配策略丛而避免全局地进行分形码 的匹配,减少了计算量。魏海等f 3 7 1 在小波变换域内,基于迭代分形对图像数据进 行压缩,然后在图像分形码的基础上,利用迭代函数系统分布特性构建的特征量 来支持图像检索。陈添丁等1 3 8 1 提出一种分形编码的图像比对搜索方法,即把迭代 函数系可反映图像的拓扑特性,用于图像的储存和检索。而图像经过分形编码后, 得到大量资料,需要一个有效的方法进行检索,文中根据f i s h e r 判别函数来判定 图像相似度。图像比对搜索引擎能准确找出查询图像的相似图像外,还证实对图 像有一定的容错性能,能有效地提高图像比对搜索引擎在实际应用中的可适性。 西北大学硕士学位论文 以上给出了部分压缩域图像检索方法的概述,由于直接在压缩数据中提取特 征,许多算法在检索速度上远远快于像素域的图像检索方法。 k l 变换虽然是统计最优的,但其固有的计算复杂性阻碍了本身及与之相关 的检索技术的广泛应用。离散傅立叶变换在图像分析中具有重要的作用,但d f t 对非周期图像信号压缩能力的差强人意,很少被用于图像压缩,其检索能力也就 无法很好的体现。矢量量化的编码过程本身就是一种索引机制,最易实现压缩域 图像检索。但矢量量化的编解码过程很不对称,编码要有很高的计算复杂度, 而解码则很快。分形虽然是在编码方面具有很大的潜能,但是分形码是高度非线 性且依赖于待编码图像,只有图像本身具有明显的自相似性或统计相似性时,才 能获得高的压缩效率。另外分形的编解码过程也很不对称。由于这些原因,基 于d f t , k l t 、矢量量化和分形等的图像检索方法在人们进行了一些探索性研究 后,并未成为基于压缩域检索技术的研究主流。不过在一些特殊领域,如多波段 遥感图像,医学图像,由于要根据图像的自身特点选取最合适的压缩方法,故这 些检索技术仍然可能有其应用潜力。 由于离散小波变换( d w t ) 技术成为新的静态图像压缩标准j p e g 2 0 0 0 的核心 算法,所以基于离散小波变换的图像检索技术将成为研究的重点:而传统的压缩 标准j p e g 采用d c t 技术,因此基于d c t 的检索技术也仍是人们关注的方向。 1 4 本文研究的主要内容与论文安排 1 4 1 主要研究内容 本文对基于内容的压缩域图像检索技术进行了初步的研究,主要讨论了如何 有效地从小波变换域中提取特征,并且依据此特征建立索引进行图像检索的方 法。主要对以下内容进行了研究: ( 1 ) 系统地论述了压缩域图像检索技术的发展现状,总结了图像检索的一 些关键技术。 ( 2 ) 对图像子带小波系数分布的统计特性进行了分析,通过实验证明对于 系数动态范围大而峰值又尖锐的图像,采用两个分量高斯混合模型对小波系数分 布的拟合效果比广义高斯分布有明显提高,证明了高斯混合模型应用于压缩域图 9 西北大学硕士学位论文 像检索的可行性。 ( 3 ) 改进了基于广义高斯分布的小波域图像检索方法。采用两个分量的高 斯混合模型拟合小波系数的统计直方图,近似描述系数的分布情况。通过e m 算 法估算出模型的参数,根据高斯混合模型的相似性匹配进行图像的检索。实验证 明,采用高斯混合模型的方法比采用广义高斯分布的方法,检索效果有一定的提 高。 1 4 2 论文安排 第一章:绪论。对压缩域图像检索技术的发展现状进行了综述,给出了本课 题的研究目的和意义。 第二章:图像检索的关键技术。介绍了基于内容图像检索的关键技术,包括 图像颜色、纹理和形状特征的提取、两幅图像间相似性度量的方法以及检索性能 的评价方法。 第三章:基于广义高斯分布的小波域图像检索方法。对经小波变换后,图像 的子带小波系数分布的统计特性进行了分析,介绍了基于广义高斯分布的小波域 图像检索方法。 第四章:本章对广义高斯函数描述子带小波系数分布的准确性进行了分析, 找出了基于广义高斯分布的小波域图像检索方法的不足。本文改用高斯混合模型 ( g a u s s i a nm i x t u r em o d e l ,g m m ) 来拟合高频子带小波系数的分布,将g m m 应用n d , 波域的图像检索中。实验对比证明,基于高斯混合模型的小波域图像检 索方法比基于广义高斯分布的方法,检索准确率有一定的提高。 第五章:总结与展望。对本文的研究内容进行总结,同时展望了研究的前景。 1 0 西北大学硕士学位论文 2 1 引言 第二章图像检索的关键技术 上一章我们已经了解了基于内容的压缩域图像检索技术的研究现状,本章将 系统地介绍图像检索的若干关键技术。本章结构安排如下:第二节介绍了基本的 图像低层特征描述方法;第三节介绍了图像匹配中一些常用的相似性侧度方法; 第四节介绍了检索性能评价的准则。 2 2 图像特征 图像的特征包括视觉特征和语义特征。通用的视觉特征包括颜色、纹理、形 状、空问关系等,常用前三种。语义特征包括文本描述以及视觉特征和文本描述 的结合。 2 1 1 颜色特征的描述 在图像检索中,颜色是使用最广泛的视觉特征。它是物体表面的一种视觉特 性,是图像最底层、最直观的物理特征。相对于其他的特征,颜色特征非常稳定, 对旋转、平移、尺度变化、甚至各种变形都具有很强的鲁棒性。颜色特征的描述 方法主要有颜色直方图、累加颜色直方图、颜色矩、颜色集、颜色相关图等。 颜色直方图 颜色直方图表示对图像中颜色出现频率分布的一种统计,它的横轴表示颜色 值,纵轴表示具有相同颜色值的像素在整幅图像中所占的比例。颜色直方图反映 的是图像中颜色的组成分布、出现了哪些颜色以及各种颜色出现的概率。其数学 描述如下: ( f ) = 万n i ( 2 1 ) 其中,i 表示图像颜色取值,埔表示图像中具有颜色值为i 的像素的个数,| 是图 像像素的总数。 西北大学硕士学位论文 颜色直方图表现的是图像的一种全局特性。每一幅图像具有唯一的颜色直方 图,但不同的图像可能具有相同的颜色直方图。s w a i n 等首先提出了使用颜色直 方图作为图像颜色特征的表示方法1 4 1 i 。他们还指出:颜色赢方图相对于图像以观 察轴为轴心的旋转、以及幅度不大的平移和缩放等几何变换是不敏感的,颜色直 方图对于图像质量的变化( 如模糊) 也不甚敏感。颜色直方图的这种特性使得它 比较适合用于检索图像的全局颜色相似性的场合,即通过比较颜色直方图的差异 来衡量两幅图像在颜色全局分布上的差异。 累加颜色直方图 当图像特征不能遍取所有可能的取值时,统计直方图中会出现一些零值,这 会对计算两幅图之间的直方图相交带来很大的影响,从而不能真实地反映两幅图 匹配的差距。假设颜色直方图中共有三种颜色并且按照一定的顺序排列,记h ( o 为第i 中颜色上的像素数目,则累加直方图可以表示为: c ) = h ( f ) ,k = 0 , 1 ,a ,l t ( 2 2 ) 实验结果表明累加直方图算法的效果和鲁棒性均优于一般的直方图【4 2 l 。 颜色矩 s t r i c k e r 和o r e n g o t 认为颜色信息主要集中在图像颜色的低阶矩中,提出了 颜色矩的方法4 引,他们主要对图像中所有像素在每种颜色分量的一阶( 均值) 、 二阶( 方差) 和三阶( 斜度) 矩进行统计。对于图像检索来说,颜色矩是一种简 单有效的颜色特征表示方法,特别是在图像中只包含目标的时候。这三个颜色矩 的数学定义如下: 鸬2 面1 荟j 厶 ( 2 3 ) 盯 万1 蔷n 饥一“) 2 ( 2 4 ) 置3 万1 蕃n 阮一一) 3 ( 2 5 ) 其中以表示像素,的颜色值为i 的概率,为图像中像素的个数。 与颜色直方图相比,该方法无需对特征进行向量化。颜色矩只用9 个数值( 3 1 2 西北大学硕士学位论文 个颜色分量,每个分量上3 个低阶矩) 表示颜色,相对于其他颜色特征而言,是 一种非常紧凑、简单的方法。这种简单性也使得颜色矩的识别能力相对较低,在 检索中通常用颜色矩来做第一次过滤,去掉那些颜色上极不相似的图像。 颜色集 为了支持大规模图像库中的快速查找,s m i t h 和c h a n g 4 4 l 提出了用颜色集 ( c o l o rs e t s ) 作为对颜色直方图的一种近似。他们首先将r g b 颜色空间转化成 视觉均衡的颜色空间( 如h s v 空闻) ,并将颜色空间量化成若干个b i n 。然后, 他们用色彩自动分割技术将图象分为若干个区域,每个区域用量化颜色空间的某 个颜色分量来索引,从而将图象表达一个二进制的颜色索引集。在图象匹配中, 比较不同图象颜色集之间的距离和色彩区域的空间关系( 包括区域的分离、包含、 交等,每种对应于不同的评分) 。因为颜色集表达为二进制的特征向量,可以构 造二分查找树来加快检索速度,这对于大规模的图象集合十分有利。 颜色相关图 颜色相关图是颜色直方图在空间的一种延伸1 4 5 】。它的主要思想是用颜色对相 对于距离的分布来描述信息,它不仅反映了某种颜色的像素数量占图像比例, 也反映了颜色对之间的空间相关性。其数学定义为: ,艺l 只k ,。( ,) 忙一e 2 i - k j ( 2 6 ) 丑e ,c ( ,与e l 其中f ,( 1 ,2 ,a ,) ,k o ,2 ,a ,d ) 。这里1 表示整个图像的全部像素,1 。,表示 颜色是c 的所有像素,旧一b i 是象素尸,和乃之间的距离。颜色相关图可以看 作是一张用颜色对 索引的表,其中 的第k 个分量表示颜色为c 俐的像素 和颜色为c 的像素之间的距离小于k 的概率。如果考虑所有可能的颜色对组合, 相关颜色图将会非常的大( o ( n 2 d ) ) ,为了减小计算量一般只考虑相同颜色之间的 相关性,即颜色自相关图。 实验表明,相对于颜色直方图,颜色相关图极大地提高了检索效率,特别是 查询空间关系一致的图像,但是由于它的维数很高,计算量也很大。 2 1 2 纹理特征 纹理是图像区域固有的特征之一,广泛的存在于各种自然物体的表面,如云 西北大学硕士学位论文 彩、树木、沙滩、水面波纹等。由于对纹理的感受是与心理效果相结合的,所以 至今纹理还没有一个正式或一致的定义。在图像检索中,纹理通常定义为图像的 某种局部性质,或是对局部区域中像素之间的邻域灰度空间分布规律的一种度 量。 纹理描述方法可以大致分成三种:统计法、结构法和频谱法。统计法是对图 像中颜色强度的空间分布信息进行统计,包括灰度直方图的矩、共生矩阵、纹理 能量、t a m u r a 特征、分形模型等。结构法认为纹理是由一些基本纹理单元按照 某种排列组合而形成的,包括形态学算子、邻接图等,通过识别结构的基本单元 和布局规律来识别纹理,对于纹理很规则的图像很有效。频谱法则在频率域范围 内利用功率谱函数以及滤波器理论来进行纹理分析。包括傅立叶变换、小波变换、 g a b o r 变换等。 在众多的纹理特征中,已经被有效应用到图像检索系统中的主要有:灰度共 生矩阵、t a m u r a 特征、g a b o r 变换、小波变换等,下面简单介绍这些特征: 灰度共生矩阵 实验证明灰度共生矩阵是一种非常有效的方法,提取的纹理特征符合人眼的 视觉特性。 灰度共生矩阵是统计空间上具有某种位置关系的一对像元灰度对出现的频 率,其实质上是从图像中灰度为i 的像素点,统计灰度为,与其固定关系为 d = ( m ,印) 的蒙素点出现的概率( 或频度) 4 6 1 。数学表达式为: p ( f ,) = 融,y ) l i ( x ,y ) = f ,g + d x ,y + d 吵) = , ,f ,= 0 , 1 ,a ,l - 1 其中,t y = 0 , 1 ,a ,一1 是图像中像素的坐标,厂g ,y ) 是该像素点的灰度级,l 是灰度级的个数,d x ,d y 是偏移量。 由于图像灰度级数目一般是2 5 6 ,这对于灰度共生矩阵的计算来说太大。为 了解决这一问题,常常在求共生矩阵之前,根据直方图均衡化预先将灰度级压缩 至工级( 一般取1 6 级) ,即将图像变为一个1 6 级的灰度级图像。在实际计算操 作中,反映固定位置关系的参数( m ,d y ) 的选择既包括偏移量,又包括方向的选 择。一般( m ,缈) 只选取以下4 种值:( o ,d ) 、p ,0 ) 、p ,d ) 、卜d ,d ) ,得到0 。、 1 4 西北大学硕士学位论文 4 5 。、9 0 。、1 3 5 。四个方向的灰度共生矩阵1 4 7 。 由共生矩阵可以产生一些特征参数来表示共生矩阵的特征,并以此来分析纹 理的特征。这些参数指标有许多,根据各自的意义和实验效果选用以下参数。在 计算这些参数之前需先对灰度共生矩阵归一化,使其个元素之和为1 。 反差: l - i l - i 彬= ( f j ) 2 p ( i ,j ) ( 2 7 ) i = 0 j = o 或称为主对角线的惯性矩,细纹理的w - 值较大,粗纹理的值较小。 能量: 是对图像灰度分布的均匀性的度量。 熵: 相关性 其中:“ 一l 一1 = p ( i ,j ) l n p ( i ,和 i = o 0 ( 2 8 ) ( 2 9 ) l 一1 一1, 氓= i x j x p ( i ,j ) - i t 幽盯。o r 2 ( 2 1o ) j c 0j = o 一tl - 1 盯:2 = ( ,一:) 2 p o ) 。相关量是用来描述矩阵中行或列元素之间相似程度 的,它是灰度线性关系的度量。 t a m u r a 特征 基于人类对纹理视觉感知的心理学研究,t a m u r a 4 8 1 等人提出了纹理特征的 表达,六个分量分别对应心理学角度上纹理特征的六种属性:粗糙度( c o a r s e n e s s ) 、 对比度( c o n t r a s t ) 、方向度( d i r e c t i o n a l i t y ) 、线性度( 1 i n e l i k e n e s s ) 、规整度( r e g u l a r i t y ) 和粗略度( r o u g h n e s s ) 。其中,粗糙度、对比度和方向性是人们区分纹理时三个最 主要的特征,己经应用在一些的检索系统中,如q b i c 和p h o t o b o o k 。 力o 驴 一 m | 1 、l,o p 脚 r p o = 盯 力o p 脚 i i 儿 力o p 舢 西北大学硕士学位论文 粗糙度:也称为粗细度,测量纹理的间隔尺寸,与图像的分辨率有关, c d d :上2 t 厂o ,) ( 2 1 1 ) m n 了 其中2 x 2 是窗口的尺寸,七是能使j 和y 方向的厂( ,) 2 2 最大化的值,一 2 蒜下 亿1 2 , 其中,盯是图像灰度的标准方差,。是灰度图像的4 阶中心矩。该公式可以用 j g | = 掣m t a n 。 刳+ 三 聊 式中的。和a ,分别表示图像按照下述两个3 3 模板进行卷积所得到的水平和 | | i l 雌到 然后对口进行量化,统计每个b i n 中相应的l g i 大于给定阈值的像素数,构造一 1 6 西北大学硕士学位论文 方图中峰值的尖锐程度获得: n d = 艺够一砟) 2 日。) ( 2 1 4 ) p 批 上式中p 代表直方图中的峰值,n 。为直方图中所有的峰值,w p 代表峰值,所包 含的所有的b i n ,。是具有最大值的b i n 。 g a b o r 变换 g a b o r 变换能够最大程度地减少空间和频率的不确定性,已被证明是在二维 测不准情况下,对信号空间域和频率域的最优描述1 4 9 1 。这些滤波器可以用于方向 和尺度都可变化的边缘和直线的检测,并且对于一个给定区域中的这些微观特性 的统计,经常可以用来表示纹理信息的特征。 人们已经提出了很多基于g a b o r 滤波器描述纹理的方法。m a n j u n a t h 和m a 5 0 】 通过试验指出,g a b o r 滤波特征提供了最佳的模式检索精度,但是其计算速度慢, 旋转和尺度不变性有待讨论。 小波变换 小波变换( w a v e l e tt r a n s f o r m ) 也是一种常用的纹理分析和分类方法。在纹 理分析上常使用的两种主要小波变换类型是:金字塔式小波变换 ( p y r a m i d - s t r u c t u r e dw a v e l e tt r a n s f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论