多媒体数据压缩编码技术_第1页
多媒体数据压缩编码技术_第2页
多媒体数据压缩编码技术_第3页
多媒体数据压缩编码技术_第4页
多媒体数据压缩编码技术_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学习要点:1、多媒体数据要所编码的重要性和分类。2、常用压缩编码算法的根本原理及实现技术,推测编码、交换编码〔K-L变换、DCT变换〕、统计编码〔Hufman〕。3、量化的根本原理和量化器的设计思想。4、静态图象压缩编码的国际标准〔JPEG〕原理、实现技术,以及动态图像压缩编码国际标准〔MPEG〕的根本原理。一、多媒体数据压缩编码的重要性和分类1、多媒体数据压缩的重要性多媒体技术最大难题是海量数据存储与传送电视信号数字化后的数据量。2、多媒体数据压缩的可能性空间冗余例:图象中的“A”是一个规章物体。光的亮度、饱和度及颜色都一样,因此,数据A有很大的冗余。时间冗余信息熵冗余信息量:指从N信息熵:指一团数据所带的信息量,平均信息量就是信息熵〔entropy〕。64326164log264=6(bits)N个数中选任意一个数X的概率为P(x),假定选定任意一个数的概率都相等,P(x)=1/N,因此定义信息量I(x)=log2N=-log2(1/N)=-log2P(x)=I[P(x)得到了信息熵(entropy)。熵就是平均信息量。Xj(j=1,2,3„„..NXP(xj),则信息源X构造冗余图象有格外强的纹理构造。如草席图构造上存在冗余。学问冗余图像的理解与某些根底学问有关。例:人脸的图像有同样的构造:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上„„视觉冗余视觉冗余是非均匀、非线性的。22就是数据冗余。其他冗余:空白的非定长性3、多媒体数据压缩方法的分类按压缩方法分:有失真压缩、无失真压缩按编码算法原理分:推测编码变换编码量化与向量量化编码信息熵编码子带编码构造编码基于学问的编码二、量化1、量化原理量化处理是使数据比特率下降的一个强有力的措施。脉冲编码调制〔PCM〕的量化处理是采样之后进行,从理论分析的角度,图像灰度值是连续的数值,而我们通常看到的是以〔0~255〕的整数表示图像灰度,这是经A/D256log2256=8图像像素的灰度值,或色差信号值。数据压缩编码中的量化处理,不是指A/D变换后的量化,而是指以PCM码作为输入,经正交变换、差分、或推测处理后,熵编码之前,对正交变换系数、差值或推测误差的量化处理。量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,期望量化后的数值用较少的比特数便可表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。量化处理总是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不行逆过程,量化处理中有信息丧失,或者说,会引起量化误差〔量化噪声〕。2、标量量化器的设计通常设计量化器有下述两种状况:▲给定量化分层级数,满足量化误差最小。▲限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。量化方法有标量量化和矢量量化之分,标量量化又可分为,均匀量化、非均匀量化和自适应量化。3、矢量量化矢量量化编码是近年来图像、语音信号编码技术中颇为流行的一种型量化编码方法。矢量量化编码方法一般是有失真编码方法。矢量量化的名字是相对于标量量化而提出的。对于PCM数据,一个数一个数地进展量化叫标量量化。假设对这些数据分组,每组K个数构成一个K维矢量,然后以矢量为单元,逐个矢量进展量化,称矢量量化。三、统计编码1、统计编码原理——信息量和信息熵图像的概率分布、信息量和信息熵之间有什么关系?在图像编码压缩理论争论中,为什么要引入信息论中“熵”值的概念,有什么重要意义?这是我们下面需要说明的问题。概念:信息:是用不确定性的量度定义的。信息量:从N个相等可能大事中选出一个大事所需要的信息度量或含量。熵:假设将信源全部可能大事信息量进展平均就得到信息的熵(熵就是平均信息量)。传输包括:传输所需要的信息。以任意小的失真或零失真接收这些信息。已经证明:只要符号速率不超过信道容量C符号可以以任意小的过失概率向该信道中传输。另外几种典型的方法是:Fans,Huffman,编码方法定理,变字长编码最正确编码定理。在变字长编码中,对于消灭概率大的信息符号,编以短字长的码,对于消灭概率小的信息符号编以长字长的码,假设码字长度严格依据符号概率的大小的相反挨次排列,则平均码字长肯定小于按任何其他符号挨次排列方式得到的码字长度。〔1〕熵、熵编码原理、变字长编码最正确编码定理(2)Huffman2、哈夫曼编码Huffman编码就是利用变字长最正确编码实现信源符号按概率大小挨次排列。信源符号按概率大小挨次排列:消灭概率最小的两个符号概率相加合成一个概率。将合成概率看成一个组合符号概率,重复上述做法,直到最终只剩下两个符号概率为止。反过来逐步向前编码,每一步有两个分支各赐予一个二进制码,可以对概率大的赋编码为“0”,概率小的赋编码为“1”。〔反之,也可以大的赋“1”,小的赋“0”〕特点:Huffman编码字长参差不齐。HuffmanHuffmanHuffman编码表省缺。好处:解决对称性,降低了编码时间。概率统计和Huffman编码一般不对称。3、算术编码2060E1ias1976Bissanen和Pasco术。JPEG,JBIG01间的实数进展编码,算术编码用到两个根本的参数:符号的概率和它的编码间隔。信源符号的概率打算压缩编码的效率,也打算编码过程中信源符号的间隔,而这些间隔包含在01之间。编码过程中的间隔打算了符号压缩后的输出。根本思路:用一个浮点输出数值代替一个流的输入符号;把要压缩的整段数据映射到一段实数半开区间[0,1)内的某一区段,然后构造出小于l且大于或等于0的一个数值,这个数值就是对该输入流进展压缩编码后的输出代码。例如:可将输入字符流“eai”映射到区间[0.23,0.2360.23,作为该输入字符流的编码。根本原理:01隔所需的二进制位就越多。是一种二元码的编码方法。在不考虑信源统计的状况下,只要监视一小段时间内码消灭的频率,不管并且只有算术运算。设编码初始化子区间为[0,1),Qe0算起,则Pe=1-Qe。随着被编码数据流符号的输入,子区间渐渐缩小。子区间的起始位置=前子区间的起始位置+当前符号的区间左端×前子区间长度;子区间的长度=前子区间的长度×当前符号的概率〔等价于范围长度〕;最终得到的子区间的长度打算了表示该区域内的某一个数所需的位数。算术编码在编、译码的过程中,子区间的起始位置和长度值的小数点后的位数越来越长,实际中无法实现。因此较有用的改进算法是限制小数点后的位数。在算术编码中需要留意的几个问题:163264算术编码器对消息只产生一个码字,这个码字是在[0,1]中的一个实数,因此译码器在承受到表示这个实数的全部位之前不能进展译码。算术编码也是一种对错误很敏感的编码方法,假设有一位发生错误就会导致整个消息译错。算术编码可以是静态的或者自适应的。在静态算术编码中,信源符号的概率是固定的。在自适应算术编码中,信源符号的概率依据编码时符号消灭的频繁程度动态地进展修改,在编码期间估算信源符号概率的过程叫做建模。需要开开发态算术编码的缘由是由于事先知道准确的信源概率是很难的,而且是不切实际的。当压缩消息时,我们不能期盼一个算术编码器获得最大的效率,所能做的最有效的方法是在编码过程中估算概率。因此动态建模就成为确定编码器压缩效率的关键。特点:①不必预先定义概率模型,自适应模式具有独特的优点;②信源符号概率接近时,建议使用算术编码,这种状况下其效率高于Huffman③算术编码实现方法简单一些,但JPEG成员对多幅图像的测试结果说明,算术编码比Huffman编5%左右的效率,因此在JPEGHuffman四、推测编码1、推测编码方法根本原理从相邻数据之间由强的相关性特点考虑,可以利用前面已经消灭的数值,进展推测〔估量〕,得到一个推测值,将实际值与推测值求差,对这个差值信号进展编码、传送,这种编码方法即成为推测编码方法。不带量化器的DPCM线性推测编码,属于无失真编码系统;带有量化器的DPCM线性推测编码,属于有失真编码系统。最正确量化器的设计,可利用人眼的视觉可见度阈值和视觉掩蔽效应等生理特征,来确定量化器的级数和步距,使量化误差总处于人眼难以觉察的范围内,到达主观评定准则的要求。自适应推测编码ADPCM:自适应技术的概念是:推测器的推测系数和量化器的量化参数,能够依据图像的局部区域分布特点自动调整。实践证明,ADPCM编、解码系统与DPCM编、解码系统相比,不仅能改善恢复图像的评测质量和视觉效果,同时还能进一步压缩数据。ADPCM系统包括自适应推测,即推测系数的自适应调整和自适应量化,即量化器参数的自适应调整两局部内容。五、变换编码1、变换编码的根本原理通过存储这些系数到达压缩的目的。本方法承受对整幅的原始图像分成很多个矩形区域子图像独立进展变换。常用变换有:卡亨南—洛维变换〔KLT〕离散余弦变换〔DCT〕沃尔什—哈达玛变换〔WHT〕离散傅里叶变换〔DFT〕。六、多媒体数据压缩编码的国际标准由国际标准化协会ISO、国际电信协会IEC和国际点心协会ITU领导下,制定的三个有关视频图像压缩编码的国家标准:JPEGH·261MPEG1、静态图像压缩编码的国际标准〔JPEG〕JPEG——联合图像专家小组标准,一种对静态图像压缩的编码算法。联合”:国际电报询问委员会CCITT和国际标准化协会ISO联合组成的图像专家小组。JPEG给出了一个使用于连续色调图像的压缩方法。JPEG到达或接近当前压缩比与图像保真度的技术水平,能掩盖一个较宽的图像质量等级范围,能到达“很好”到“极好”的评估,与原始图像相比,人的视觉难以区分;能适用于任何种类的连续色调的图像,且长宽比都不受限制,同时也不受限于景物内容、图像的简单程度和统计特性等。计算的简单性是可掌握的,其软件可在各种CPU上完成,算法也可用硬件实现。JPEG挨次编码——每一个图像重量按从左到右,从上到下扫描,一次扫描完成编码;累进编码——图像编码在屡次扫描中完成。累进编码传输时间长,接收端收到的图像是图像是屡次扫描由粗糙到清楚的累进过程;无失真编码——保证解码后,完全准确地恢复源图像采样值,其压缩比低于有失真压缩编码方法;分层编码——图像在多个空间区分率进展编码。在信道传送速率慢,接收端显示器区分率也不高的情况下,只需做低区分率图像解码。DCT第一步:分割子块其次步:对子块进展正向离散余弦变换FDCT;第三步:对获得的DCT系数进展量化处理;第四步:DCAC第五步:熵编码。熵编码可分成两步进展,先把DC码和行程码转换为中间符号序列,然后给这些符号赋以变长码字。JPEGHuffman使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的沟通AC在JPEG查表(lookuptable)方法进展编码。压缩数据符号时,霍夫曼编码器对消灭频度比较高的符号安排比较短的代码,而对消灭频度较低的符号安排比较长的代码。这种可变长度的霍夫曼码表可以事先进展定义。2、MPEGMPEGMovingPictureExpertsGroup是特地制定多媒体领域内的国际标准的一个组织,该组织成立于1988300名多媒体技术专家组成。MPEGMPEG最初MPEG31.5Mbps,lOMbps,40Mbps命名为MPEG-1,MPEG-2,MPEG-3。l992年,MPEG-2适用范围扩大到HDTV,能支持MPEG-3的全部功能,MFEG-3MPEG-1标准:MPEG-11.5MbpsMPEG-11.5Mbps一个单一的MPEGMPEG-14①MPEG②MPEG视频:定义视频数据的编码和重建图像所需的解码过程,亮度信号区分率为360×240,色度信180×120;③MPEG④全都性测试。MPEG-1此外,MPEG解码过程是不对称算法,解码过程要比编码过程相对简洁。实际上,MPEG-1MPEG-2方案,重点将解码算法标准化。因而用硬件实现MPEG算法时,人们首先实现MPEG的解码器,如C—CubeCL450MPEGMPEG音频压缩算法是第一个高保真音频数据压缩国际标准,它同时可完全独立应用MPEG32kHz,44.1kHz48kHz;4种模式之一支持单声道或双声道;压缩后的比特流具有预定义的比特率之一;MPEG3编码后的比特流支持循环冗余校验CRC;MPEGMPEG仅使用帧内编码方法无法到达很高的压缩比;用单一的静止帧内编码方法能最好地满足随机存取的要求。具体实现中承受了一个折中解决方案,在MPEG算法中承受两种根本技术:基于块的运动补偿技术,目的是削减时间上冗余性;基于DCT变换的ADCT基于块的运动补偿技术——MPEGMPEG3I利用图像自身的相关性压缩,供给压缩数据流中的随机存取的点,承受基于ADCT的编码技术,压缩1~2IJPEGP用最近的前一个I图像(或P图像)推测编码得到(前向推测),也可以作为下一次推测的参照图像,也称为推测图。BB图橡在推测时,既可使用前一个图像作参照,也可使用下一个图像作参照或同时使用前后两个图像作为参照图像(双向推测),也称双图。4帧内编码;(2)前向推测;(3)后向推测;(4)双向推测基于块的运动补偿技术:运动补偿技术主要用于消退P图像和B图像在时间上的冗余性,提高压缩效率。MPEG所谓基于块的运动补偿技术即:在参照帧中查找符合肯定条件限制、当前被推测块的最正确匹配块;当找到匹配块后,在恢复被推测块时,承受两种处理方法:直接用匹配块代替;用匹配块加上推测误差〔推测误差承受ADCT编码〕。每个包含运动信息的16×16宏块,相对于前面相邻块的运动信息作差分偏码,得到运动差值;然后对运动差值,使用变长码编码方法,进一步压缩数据。留意:MPEG标准只说明白怎样表示运动信息,并没有说明运动矢量如何计算。MPEG-2MPEG-219901993年ISO的高质量图像和声音编码标准。MPEG-2可以说是MPEG-1MPEG-2增加了很多MPEG-1(scalability)功能。MPEG-24~9Mbit/s,最高达15Mbit/s。MPEG-2的标准号为ISO/IEC13818,标准名称为“信息技术—电视图像和伴音信息的通用编码MPEG-2MPEG—2(1.5Mbps以上),来支持具有更高区分率图像的压缩和更高的图像质量;为了适应不同应用的要求,保证数据的可交换性,定义了不同的功能档次,每个档次又分为几个等级编码器的设计有较大的自由度MPEG-211种标准,以保证与MPEG-1求;MPEG-2MPEG—1MPEG-2的编码方法和MPEG-l的区分主要是在隔行扫描制式下,DCT变换是在场内还是在帧内进展由用DCT;而细节少、运动重量多的图像在场内进展DCT。MPEG—2MPEG2视频体系要求必需保证与MPEG1/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论