(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(软件部分).pdf_第1页
(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(软件部分).pdf_第2页
(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(软件部分).pdf_第3页
(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(软件部分).pdf_第4页
(通信与信息系统专业论文)e1接口感知话音质量(pesq)测试设备实现方案(软件部分).pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京邮电大学硕士研究生学位论文摘要 摘要 为了客观评价语音质量,i t u t 推出了e 8 6 2 标准的p e s q 算法,p e s q 算法既建立在 客观评价模型的基础上,又使得客观评估结果与主观评定结论一致性最高,效果良好。 本文就是提出并设计完成一种基于p e s q 算法的e 1 接口上的客观语音评价的测试系 统。该测试系统基于e l 接口,它分为硬件和软件两部分实现,我论文的重点就是软件实 现原始语音的发送到失真的语音的接收采集的一系列过程:将存贮在测试设备内的多段原 始语音材料,经e 1 接口进入待测系统,经过系统失真的语音又返回测试设备e 1 接口并被 记录,这些原始测试语音及经失真的语音通过设备监控接口( r s 2 3 2 ) 送到p c 上,p c 上 按照e 8 6 2p e s q 算法给出每段语音的评价分值。 文章首先对p e s q 算法的原理作了简单的阐述,然后介绍了系统的实现方案、总体框 架及各功能模块,并对系统设计中需要用到的芯片及技术作了简单介绍。最后介绍了系 统软件模块的框架,系统软件模块的实现,包括了初始化( r e s e t ) 及配置管理部分、a t m e g a 1 2 8 侧串口通信、外部s r a m 与e l 接口通信、告警处理、误码性能监测这几个软件模块。 我同学詹春伟实现了测试系统硬件部分。 天疆记 语音音质评价:i t u tr 8 6 2 建议:p e s q 算法;e 1 接口;测试方案 南京邮电大学硕士研究生学位论文a b s t r a c t a bs t r a c t f o re v a l u a t i n gt h es p e e c hq u a l i t yo b j e c t i v e l y , t h ei t u tp u tf o r w a r dt h ep e s qa r i t h m e t i c i ni t sr 8 6 2r e c o m m e n d a t i o n t h i st h e s i si sa i m e dt oi m p l e m e n tt h es p e e c hq u a l i t yt e s t e ro ne1i n t e r f a c eb yt h ep e s q ( p e r c e p t u a le v a l u a t i o no fs p e e c hq u a l i t y ) a l g o r i t h m t h ed e s i g nd i v i d e si n t ot w op a r t s :t h e h a r d w a r ea n ds o f t w a r e t h em a i nt a s kf o rm ei st h es o f t w a r ed e s i g n t h ek e yf u n c t i o no ft h i s t e s t e ri st os e n do u tt h eo r i g i n a ls p e e c hm a t e r i a l s ,t h a ts t o r e di nt h et e s t e rm e m o r y ,t ot h et e s t e d s y s t e me n t r a n c ew i t he 1i n t e r f a c ea n dt h ed e g r a d e ds p e e c hs i g n a l s ,t h a ti st h eo u t p u to ft e s t e d s y s t e m ,w i l lr e t u r nt ot h et e s t e ra n dw i l lb e s t o r e da l s o t h eo r i g i n a la n dd e g r a d e ds i g n a l sa r e t h e ns e n tt op cb yr s 2 3 2i n t e r f a c e w ec a nt h e ng e tt h er a t i n gs c o r eb a s e do ne 8 6 2p e s q a l g o r i t h mt h a ti sp a r k e do nt h ep cp r i o r f i r s t l y ,t h ep a p e ri n t r o d u c e st h ep e s qa l g o r i t h mb r i e f l ya n dt h e ni n t r o d u c e st h ew h o l et e s t s y s t e ms t r u c t u r ec o n s i s t e db ym a i nc o m p o n e n t so fc h i p sw ec h o o s e n l a s t l y ,i tp r o v i d e st h et e s t s y s t e ms o f t w a r ef u n c t i o n sa n di m p l e m e n t a t i o n so fm a i ns o f t w a r em o d u l e s t h ep a r to fh a r d w a r e w 0 qd o n eb ym yc l a s s m a t em rz h a n k e w o r d : s p e e c hq u a l i t y ;p e s q ( p e r c e p t u a le v a l u a t i o no fs p e e c h q u a l i t y ) a l g o r i t h mo b je c t i v e s p e e c hq u a l i t yt e s t e r ;e 1i n t e r f a c e 南京邮电大学硕十研究生学位论文前言 日i l青 语音作为信息传递的重要载体,与其相关构成的通信、编码、存储和处理等语音系统 已成为现代社会信息交流的基本手段,己广泛应用于社会各个领域这些系统的性能好坏成 为信息交流是否畅通的重要因素,而评价这些系统性能优劣的根本标志是在于系统输出语 音质量的好坏。因此,研制灵活、方便、可靠的语音质量评价系统自然成为国内外研究者共 同努力的目标。 语音音质评价从主体上可分为主观评价和客观评价2 种。由于音质的好坏最终取决于 人的主观感受,所以在语音系统中采用主观评价是语音质量的真实反映,但是这种方法费时 费力,而且受种种测试条件的限制和测试人员主观因素的影响,使得测量结果的可靠性受到 一定影响。要对日益庞杂的系统输出语音进行主观测评,工作量巨大。因此,研制灵活、方 便、快捷、可靠的语音质量评价系统极其必要。客观评价是指用机器自动判别语音质量, 不受条件限制和人的主观因素影响,应用灵活,不同时间和不同场合的测试结果也便于直接 比较。因此,它在语音设备的开发、研制、生产和通信网的规划建设中有广泛的应用前景。 针对主观评价的缺点,i t u t 推出了e 8 6 2 建议,该建议推荐使用p e s q ( p e r c e p t u a le v a l u a t i o n o f , 2 p e e e hq , a l i t y ) 算法。 客观评价从评价结构上可分为2 类评价方式:基于输入输出方式的客观评价和基于输 出方式的客观评价。基于输入输出方式的评价是建立在原始语音信号和经过语音通信系统 后的语音信号的误差对比上,近年来研究较多、效果较好的语音音质客观评价方法大都采用 这种方法,其中,优秀的算法已经成为i t u t 的建议标准,如本文所介绍的p e s q 算法等。基 于输出的客观评价是仅以语音系统的输出信号来评估语音质量的好坏,目前这种形式的客 观评价方法与主观评价的相关度还较低。近年来客观评价方法取得了较快发展,与主观评 价结果的相关度可达到0 9 5 左右,这些进步很大程度上得益于人类听觉模型和判断模型 技术的应用。听觉模型在语音质量客观评价研究中占有重要的地位。纵观客观评价的发展 过程可以清楚看到,只要在评价中考虑了人对语音信号的感知特性就会大幅度提高整个评 价方法的性能。从近几年的研究成果来看,性能较好的客观评价方法都以听觉模型为基础。 判断模型的研究已开始得到重视,人对语音质量的评价包含听音( 感知) 过程和判断( 评价) 过程,冈此,有必要将判断模型与听觉模型结合起来,建立更符合主观评价过程的客观评价方 法,即采用i t u - - t r 8 6 2 标准的p e s q 算法。 随着当前通信技术日新月异的发展,特别是无线通信、个人移动通信、卫星通信、互联 网等新语音通信技术的迅猛发展,对应用机动灵活、不受时间场合限制的客观语音质量评价 v 南京邮电大学硕士研究生学位论文 技术的需求愈发迫切了。 本文提出并实现了一个基于p 8 6 2 中的客观评价算法的语音音质客观评价系统。虽然 有众多厂商在开发并已经开发出几种用于网络上的感知语音评价仪器,但专用测试设备, 特别是基于e 1 接口的感知语音测试设备还未见到。本课题就是基于这一实际需要,完成e 1 接口感知话音质量( p e s q ) 测试设备的研究及硬件与软件实现。 南京邮电大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示了谢意。 研究生签名: 地日期: 丝望:生形 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留 本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其 他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一 致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布 ( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权 南京邮电大学研究生部办理。 研究生签名:查拙导师签名:墨迦日期:翌星:生够 南京邮电大学研究生学位论文第一章语音质量评估方法简介 第一章语音质量评估方法简介 在语音通信技术中,对语音质量的评价方法,归纳起来大致可以分为两类,即客观评定 方法和主观评定方法。 客观评定方法用客观测量的手段来评价语音编码的质量,常用的方法有信噪比、加权信 噪比、平均分段信噪比等。 主观评价方法符合人类听话时对语音质量的感觉,因而目前得到广泛应用。最主要的主 观评价方法是主观评定等级( s u b j e c t i v eo p i n i o ns c a l e ) ,或称为平均评定得分( m e a no p i n i o n s c o r e ,缩写m o s ) 。 1 1 语音质量评估方法介绍 m o s 得分采用五级评分标准,其方法是,由数十名试听者在相同信道环境中试听并给予 评分,然后对评分进行统计处理,求出平均得分。在这里特别需要说明的是,试听者对语 音质量的主观感觉往往是和其注意力集中程度相联系的,因而,对应于主观评定等级,还 有一个收听注意力等级( l i s t e n i n ge f f e c ts c a l e ) 。 从用户角度看,通常认为m o s 分4 0 - - 4 5 为高质量语音编码,到达长途电话网的质量 要哕m o s 命3 5 分左右称作通信质量,这时听考能感带- n 语音质量有所下降,但是石影 响正常的通话,可以满足多数通信系统使用要求。m o s 分3 o 分以下称为合成语音质量, 这种语音一般只有足够高的可懂度,但是自然度较差,不容易识别讲话者。 常用的m o s 分评估方法包括主观m o s 分评估和客观m o s 分评估。 1 2 主观评估 主观m o s 分采用i t u tp 8 0 0 1 5 和p 8 3 0 1 6 建议书,由不同的人分别对原始语料和经 过系统处理后有衰退的语料进行主观感觉对比,一般需要2 0 - - - - 5 0 人完成,要求每个人在 听完一段语音片段后根据自己的感受给出一个分数,再将这些分数求平均值,从而得到最 后的主观m o s 分。 i t u tr 8 0 0 协议中给出了几种不同的主观评定方法,其中最简单的是a c r ( a b s o l u t e c a t e g o r yr a t i n g ) 方法。这种方法是建立在多人主观评定打分基础上的一种基本话音质量 评估方法,分数分布如表1 - l 。另外,协议还提出了d c r ( d e g r a d a t i o nc a t e g o r yr a t i n g ) 方法 和c c r ( c o m p a r i s o nc a t e g o r yr a t i n g ) 方法。d c r 方法是让评定主体先后听到参考语音和失 真语音,然后根据感觉对听觉失真评定,评定标准如表1 2 所示。c c r 方法是比较听到的 参考语音和失真语音,评定失真语音的质量比参考语音好或者坏多少,评定标准如表1 3 1 南京邮电大学研究生学位论文 第一章语音质量评估方法简介 所示。a c r 是在通信系统评估中最常用的方法。 得分评价 5 优异( e x c e l l e n t ) 4 良好( g o o d ) 3一般( f a i r ) 2较差( p o o r ) l极差( b a d ) 表1 1m o s 的主观评定标准 得分评价 5 感觉不到失真 4可感觉到失真,但是不讨厌 3感觉到失真,且有些刺耳 2 刺耳 1 非常刺耳 表1 2d c r 评定标准 得分评价 3 非常好 2 较好 1 稍好 o 大致一样 1 稍差 2 较差 3 非常差 表1 - 3c c r 评定标准 在对通信系统的主观听觉测试中,需要注意以下几点: 测试要在一个安静的噪音受到控制的房间里进行; 测试用的电话装置符合标准: 测试录音长为8 s 左右,内容是不相关的两个句子; 测试要对每个编译码环境下由两个男性和两个女性发声的语音进行评定; 2 南京邮电大学研究生学位论文第一章语音质量评估方法简介 测试主体皆非专家。 一旦测试完成,对所有测试主体的打分取平均值,这个平均值就是m o s 分。 由于主观评定方法建立在人的主观听觉之上,很切合话音通信的用户满意程度指标,也 可以将各种话音损伤因素( 噪音,误码,时延抖动,时频域失真,回声等) 对人的感知效 果综合到听音系统中,因此是一种最重要的语音质量评估方法。 但是,该方法也有其缺陷,应用起来费时费力,在不同试验主体间分散性大,难以用仪 表实现,在现实的网络评估过程中很难实现,所以又引入了客观评估算法。 1 - 3 客观评估 客观语音评估方法旨在通过对语音的材料计算给出m o s 评估分值,并使该估计值能尽 量贴近主观评定方法得到的m o s 分值结果。目前能提供主客观相关性较高的音质客观评 价方法,都是考虑了人耳的听觉特性,使用听觉感知模型来模拟收听这一过程的。因此当 前的主流是使用感知模型来评估非线性和易出错的音频通信系统。 下面具体介绍几种客观评估方法。 1 - 3 1p s q m 评估方法 p s q m 是p e r c e p t u a ls p e e c hq u a l i t ym e a s u r e 的缩写,即感知语音质量钡2 。tl y 9 6 年被 国际电联i t u t 采纳成为e 8 6 1 建议,它用于电话带宽在3 0 0 3 4 0 0 h z 之间的语音编解码器 的客观质量的测量。基本结构如图1 1 所示。这个模型的核心是听觉变换,它模拟了人的 听觉系统的主要心理和物理处理过程。计算信号在时域和频域的响度级,表示的步骤如下: 1 用长为3 2 m s 的汉宁窗对语音信号做短期傅立叶变换,相邻的帧有5 0 的交迭; 2 经过短期傅立叶变换后,信号功率谱的频率变换到5 6 频带的巴克谱域( 一种由听 觉实验确定的音频子带划分方法,按这种划分,同一个子带内较强的频率信号能 掩蔽或使无法分辨其中较弱的频率信号从而简化了听觉感知数学模型) 。 3 局部衡量:对退化语音信号功率逐帧进行部分补偿到基准语音信号功率的水平, 来实现消去低频增益调制; 4 模拟电话机接收频率特性滤波; 5 添加h o t h 噪声( 一种室内环境噪声仿真信号标准源,属于i e e e 标准) ; 6 信号响度映射到压缩的响度级域; 7 逐帧补偿退化语音信号的响度级到基准语音信号的水平。 早期计算质量评估得分的方法都是基于退化语音信号与基准语音信号在听觉变换过 南京邮电人学研究生学位论文第一章语音质量评估方法简介 程中产生的平均干扰计算。p s q m 引入了认知模型来描述退化语音信号与基准语音信号在 听觉变换过程中产生的干扰差。它通过模拟两个效应,即不对称和对语音信号不同部分的 不同加权,改进了客观评估分与主观m o s 分的相关性。 当输入信号通过编解码器和传输系统非线性失真( 如时延波动) 后,此时的数学模型 很难将失真信号在时频分量上线性表达为原始信号加失真信号,但客观评价失真输出信号 时采用了上述线性分析模型,由计算输入输出信号的时频分量的差值,得出干扰函数用以 评估语音质量,这造成客观失真模型得出的失真预测值小于实际主观听觉失真,这种误差 就是不对称效应。这个效应可由计算不对称干扰密度来补偿。不对称干扰密度由干扰密度 乘以一个不对称因子得到,不对称因子等于失真信号对原始信号的音调功率密度比的1 2 次幂,不对称因子的合理选取改善并修正了主客观评价模型的误差。 发生在语音活动期的干扰比发生在语音静默期的干扰更令人烦扰,这个效果可以由加 权因子来模拟,这个加权因子可根据试验内容改变。 在1 9 9 6 1 9 9 9 年,p s q m 被进一步改进以适用于实际系统的端到端测试,产生了一个 新的模型p s q m 9 9 。 图1 1p s q m 原理图 预测 1 3 2p a m s 评估方法 p a m s 是p e r c e p t u a la n a l y s i sm e a s u r e m e n ts y s t e m 的缩写,即感知分析测度系统。它的核 心是扩展的巴克谱失真( b s d ) 模型,该模型是h o l l i e r 通过组合一系列用于谱分析的线性滤 波器,不仅考虑了失真大小还考虑了失真的分布。p a m s 用于评估电话网络和语音编解码, 是第一个可用于端到端系统的评估,包括滤波和时延变化造成的影响的模型。基本结构如 图1 2 所示。 这个模型首先进行时间轴校准,用多个处理步骤来校准基准语音信号与退化语音信 号。语音信号被划分成一段一段的说话,计算时延变化,例如该时延变化是由于基于包的 时延波动引起的,比方说i p 电话系统。基准语音信号和退化语音信号都要补偿到一个标准 4 南京邮电大学研究生学位论文第一章语音质量评估方法简介 的听觉电平。听觉变换过程如下: 基准语音信号 听觉变换 , 调整 、l卜感知层一 r 误擎计算li i 低 i 和 待测系统 补偿 t , 。l 听觉变换 退化语音信号 、 l 图l - 2p a m s 原理图 1 用输入滤波器来模拟电话机的响应以及人耳的生理结构;1 2 用一组线性滤波器把信号变换到巴克谱的1 9 个频带域; 3 计算每个巴克谱频带内每4 m s 帧的平滑的功率包络; 4 基准语音信号功率部分补偿到退化语音信号功率的水平,确定补偿因子; 5 把信号映射到响度( 单位为方) 域; 6 把信号映射到响度级( 单位为宋) 域。 基于基准语音信号和退化语音信号的听觉变换过程计算一系列误差参数,从而对不同种 类的失真进行了测量。这些误差参数在时间上取平均值,然后通过一个非线性函数映射到 质量评估得分,这个非线性函数保证误差参数与质量评估得分间是单调的。最后计算得到 两个质量评估得分,即在a c r 主观评估方法中的主观m o s 分和听觉努力度得分。听觉努 力度是指测试主体听完测试语音后对所听到的句子的理解难易程度打分,评价标准如表1 4 所示。 得分评价 5 完全放松 4 需要集中注意,努力可忽略 3 需要适中的努力倾听 2 需要相当的努力倾听 l 完全无法理解 表l 一4 听觉努力度评价标准 1 3 3p e s q 评估方法 1 3 3 1 p s q m 、p a m s 的局限性 南京邮电大学研究生学位论文第一章语音质量评估方法简介 编解码评估模型,例如p s q m ,存在局限性,使得当它们在特定应用特别是在包括线性 滤波器或具有时延变化的系统中产生的结果不可靠。这些影响,再加上一定类型的编码失 真、包丢失和背景噪声,就是引起p s q m 等早期模型产生不精确得分的原因。因此i t u t 1 2 研究组进行了一项实验来找到一种新的模型,以期能适应更广泛的编解码器和网络情 况,具有更好的性能和表现。在比较中,p a m s 和p s q m 9 9 ( p s q m 的更新和扩展版本) 两 种算法的性能最好,然后就结合了这两种算法产生了一个新的模型,叫做感知语音质量评 估( p e s q :p e r c e p t u a le v a l u a t i o no fs p e e c hq u a l i t y ) 。2 0 0 1 年2 月p e s q 被确定为e 8 6 2 建议 4 】。 1 3 3 2 p e s q 原理简单介绍 图1 3 为p e s q 的原理图。开始时两个信号都通过电平调整,调整到一个标准的听觉电 平,再用输入滤波器模拟标准电话听筒进行滤波( i r s 滤波) 。这两个信号要在时间上对准, 并通过听觉变换( 即感知模型) 转换为内部表示。这个变换包括:通过加窗的快速傅立叶 变换从时域转换到频域;对系统中线性滤波和增益变化的补偿和均衡;把巴克谱映射到响 度级。参考语音信号与退化语音信号的变换之间的差别由扰动来表示。扰动过程中提取出 两个失真参数,在频率和时间上总和起来,映射到对主观平均意见分的预测。扰动过程包 含仑t 下过程:计算干扰密度:不对称处理;时频干扰的总计。此法充分考虑了取信号之间 的时间定位可能不正确,这样会导致每部分的时延都错了。它采用两信号交叉互相关的极 大值校验新的时延值,对每个错误的部分重新定位,重新计算干扰值。在重定位以后再总 计瞬间和整个信号的性能。 参考语音 听觉变换 信号 输入 时间 电平调整 剧 上 7 滤波器 j e 、r 待测系统 调整掂揽耀l 7认知模型 卜 lk 电平调整 输入 7 jj 退化语音 漉波器 和校准 1 测i 信号 听觉变换 t 重额讶嚏兰语音间隔 图1 3p e s q 原理图 p e s q 中的听觉变换是一个生理声学模型,用来计算两路输入信号的距离一p e s q 得分, 然后将这个分数通过一个单调( 经验) 函数映射到类m o s 分域。这个输出分值的范围在 6 南京邮电大学研究生学位论文 第一章语音质量评估方法简介 0 5 - 4 5 之间,分值越接近4 5 分,表明声音质量越好,反之,声音质量越差。在通常情况下, 输出分值在1 0 , - - , 4 5 之间,分值在2 分或2 分以下,表明语音质量比较差,难于听懂。 1 3 3 3 p e s q 结果分析 条件m o s 分是最常用的主观质量评估方法,即4 个或4 个以上的不短于8 s 的测试语音 的m o s 分的平均值。这些测试语音是由2 个男性和2 个女性所说,内容是不同的句子对。 因此,条件m o s 分是与测试材料无关的质量评估方法。在比较主客观m o s 分时经常就是 比较主客观的条件m o s 分。对主客观m o s 分逐个比较通常是不可行的,因为主观评价的 结果严重依赖当时参加主观评价的主体的主观因素以及当时的测试环境,这就导致两个主 观评估过程都是没有可比性的,同样,主客观的评估过程也是如此。因此,计算两者之间 的映射关系是很有必要的。先把p e s q m o s 分映射到主观m o s 分域,这个映射函数是根 据大量测试所得的一个单调的3 次多项式经验函数。p e s q 和主观m o s 的相关程度可以用 测量相关系数来衡量,通常在将客观分映射到主观分之后,在条件平均的情况下计算互相 关系数。互相关系数由皮尔森公式 4 】计算,如公式( 1 ) : 厂:丝型坚坚 公式( 1 ) e ( x i - x ) 2 e ( y i - y ) 2 、。 其中万。是在情况i 时的条件m o s 分,孑是在所有情况下的五的平均值,j ,是在情况i 时 p e s q m o s 分映射到主观m o s 分的条件m o s 分,罗是在所有情况下的y f 的平均值。 在确定上述经验映射过程中,由著名的2 2 个i t u 基准实验证实,平均相关性是0 9 3 5 。 最后确定p e s q 方法有效性的八个实验中,平均相关性也是o 9 3 5 ,可见该方法的主客观效 果是非常接近的。 另外又定义了残留误差 4 】,回归映射去除了客观分值和主观m o s 之间的所有系统偏 移量,使得残留误差的均方值最小,如公式( 2 ) 所示: 白= 均一卵公式( 2 ) 可以用各种各样的测量法来表示残留误差,从不同的角度来验证客观分和主观m o s 分的 相似度。 p e s q 开发过程中将各种客观评估算法分别与主观评估算法在平均( a v e r a g e ) 和最坏 情况( w o r s t c a s e ) 下统计了它们之间的相关系数,该数值越接近1 ,表示客观评价与人耳 主观评估结果越接近,从而决定方法的优劣与取舍。可见与主观评价结果的符合度仍然作 为客观评定标准的终极目标而存在。 1 3 3 4 p e s q 算法对原始语音资料的具体要求 南京邮电大学研究生学位论文第一章 语音质量评估方法简介 原始语音资料应包含由静默所隔开的语音脉冲,静默代表人说话中的自然停顿, 至少需要l s 。尽管不同语言各不相同,语音脉冲的持续时间典型为1 3 s 。特定 的声音活动探测器只对2 0 0 m s 以上的静默期敏感。语音的活动期应占总语音长 度的4 0 8 0 ,故一般规定最小语音活动期为3 2 s ,尽管不同语言也各不相同; p e s q 对参考语音和退化语音做电平调整时用的是均方根( 有效值) 电平。如 果语音的开始与结尾有很长时间的静默,那么电平调整的结果就会受影响。我 们建议语音的开头与结尾的静默最小为0 5 s ,以保证参考语音能与退化语音同 步。如果系统的延迟较大,那么允许语音的开头与结尾的静默最大为2 s ; 原始语音资料应包含由静默隔开的句子对,持续8 s 左右,句子应是有意义的, 句子间是没有联系的,尽量不要包含很多短的语句,例如快速数数;有些情况 下可能要用包含3 4 个句子的语音信号,也就是1 2 s 左右。p e s q 算法可应用于 最长3 0 s 的语音。在现场的实地测试中,语音要稍短,至少需要持续3 2 s ; 参考语音( 即原始语音材料经过频率整形,直接用于p e s q 算法) 存储时的电 平应至少达到3 0 d b o v ,以避免峰点削减和量化失真。其中d b o v 定义如下:z d b o v 口yd b m 0c 。对于a 率编码系统,c 的值为6 1 5 d b ,对于率编码系统, c 的值为6 1 8 d b ; 如果一个环境需要在长周期上测试,那么对每个8 - 2 0 s 长短的语音信号进行单 独的p e s q 处理是比较合适的。这么做还有附加的好处:如果同一个语音信号 在各个环境下使用,那么在各个环境下的时间变化将会很明显;否则,如果使 用不同发声者的不同语音信号,那就要求系统对发声者和测试语音的依赖度有 更精密的度量; 参考语音信号与退化语音信号应以8 k h z 的抽样率、1 6 b i t 的线性p c m 编码的 格式存储。p e s q 同时支持8 k h z 和1 6 k h z 的抽样率。这时的语音信号不能再 受到由不必要的量化、振幅削减或再抽样引起的失真。 1 3 3 5 背景噪声的添加 利用p e s q 去评估有背景或环境噪声存在的系统承载语音是可能的 4 。噪声录音应当 被通过一个类似于修正的i r s 传送特征的适当的滤波器,这对于例如被发送滤波器严重削 弱的汽车噪声这样的低频干扰尤其重要,然后将噪声电平调整到预定的测试电平。因为 p e s q 考虑了在a c r ( a b s o l u t ec a t e g o r yr a t i n g 一绝对等级评定) 中对主观评定产生干扰的 南京邮电大学研究生学位论文 第一章语音质量评估方法简介 因素,加入的噪声和任何编译码失真效果是一样的,因此p e s q 中使用的原始信号应当是 纯净的,然后噪声应当在信号加入到测试系统之前被加进去。 无噪音和有噪音加入的处理过程见图1 4 、图1 5 。 图1 4 干净语音的测试 噪声 图1 5 加噪声语音的测试 1 3 3 6 测试参数的选择 多种测试条件与质量因素会影响主客观评估过程。i t u tp 8 3 0r 1 4 1 协议列举下列影响 主观评估的因素: 1 编解码器的输入语音电平 2 主观试验中的听觉电平 3 发声者( 包括多重的同时讲话的发声者) 4 在编解码器间的传输通道中产生的误码 5 编解码器有多于一种比特率的工作模式下的比特率 6 编码间的转换 7 编译码器采用的比特率不符( 适用于编解码器有多于一种比特率的模式) 8 发送方的环境噪声 9 网络消息信号( 如带内信令信号) 作为编解码器的输入 1 0 音乐作为编解码器的输入 p e s q 可适用其中的1 ,4 ,5 ,6 和8 ,其它因素在客观评估中的实用性还正在研究中。 1 3 3 7p e s q 算法的应用 p e s q 算法能够对以下情况给出精确的预测值:包括编解码和误码失真,波形编码( 如 g 7 1l ,g 7 2 6 ) ,c e l p 和高于4 k b s 的混合编解码( 如g 7 2 8 ) ,移动编解码系统( 包括g s m f r , 9 南京邮电大学研究生学位论文 第一苹语晋质量评估方法偷介 e f r ,h r a m r ,c d m a e v r c ,t d m a a c e l p ,v s e l p 和t e t r a ) 。p e s q 能够用于编解 码或系统评估、选择和优化。因此,p e s q 可以广泛地用于现场和模拟网络中端到端测量, 完全符合本系统的要求。因为p e s q 具有固定的听觉电平,因此一般不能用来评估收听电 平变化、侧音说话人回音,或对话延迟的影响。另外一些应用的特性还没有得到验证,或 者需要对算法进行部分调整,包括:音乐音质、宽带话音、接收端回声和低于4 k b s 的低 比特率编解码器等。 l o 南京邮电大学硕士研究生学位论文第二章测试设备实现方案及芯片介绍 第二章测试设备实现方案及芯片概述 该课题的设计任务是基于p e s q 算法的e 1 接口上的语音质量测试设备,我承担的是 其中的a t m e g a l 2 8 软件编程。此类底层软件与高层软件相比,有显著的特点:首先它与硬 件,处理器密切相关,大部分属于固件( f i r m w a r e ) 范畴,它的处理器编程面向低层的硬 件接口进行,对硬件结构必须十分了解;其次,智能控制器件采用微处理器( 妒) ,虽然 在开发平台上可能有c 语言等编译工具,但面对高速高效处理时,汇编是不可或缺的工具。 考虑到设备在测试状态时,要从e l 电路的某6 4 k b p s 时隙连续输出和接收同步信号,必须 采用1 2 5 1 t s 的帧中断功能实现同步的码流和异步的处理器之间的匹配,因此在介绍具体软 件实现以前,必须对相关硬件及处理器结构与主要功能芯片作以介绍。 2 1 测试设备方案创意 面对给出的任务,课题组( 包含硬件和软件任务组) 首先要考虑硬件实现的方案,经 过连续几周的讨论,考虑过几种方法,起初考虑设计一个复杂的硬件装置,该装置可以每 帧分别异步地接收和发送面向处理器管理r a m 中的一个字节( 字节接口) ,该字节到同步 e 1 码流的映射( 插入,抽取) 由同步逻辑电路完成,只要配置好相应的时隙。这种力案;、j 点是处理器负担轻,但同步逻辑设计复杂;但随着对e 1 接口芯片m t 9 0 7 5 的深入了解, 另一种方案取代了它,即m t 9 0 7 5 的时隙( 收发) 字节具有可以经该片外部妒接口读写 的功能,而字节到e 1 码流的同步功能在片内可以自动实现,只要设计一个高优先级的帧 中断信号,使得c p u 对字节的访问提前、滞后于片内的操作时隙就可不影响片内同步收发 就可以大大简化设计。该方案逐步清晰起来,这是一个由目标任务到方案构想的创意过程, 该方案考虑到了下述设计任务:是基于p e s q 算法的e l 接口上的语音质量测试设备。 经过选择的多段语音原始材料存贮在测试设备内,经e l 接口进入待测系统,经过系 统失真的语音又返回测试设备e 1 接口并被记录,这些原始测试语音序列及失真的语音段 落序列通过设备监控接口送到p c 上,p c 上按照r 8 6 2p e s q 算法 4 】给出每段语音的评价 分值,可以从p c 控制将多种来源的原始测试语音材料( 按照某种格式) 灌注到设备存储 器内( 不少于8 段,每段约1 0 秒) 。语音材料的选择要求符合p 8 6 2 建议。 这主要包括以下4 个模块,一是e 1 接口模块,本模块的功能是实现e 1 接口并对存储 在s r a m 中的原始语音序列,转换成e l 数据流的格式发送出去。同时对经过待测系统失 真后的语音接收并在m c u ( 微控制器) 的控制下存储到s r a m 中;二是m c u 模块,该部分 南京邮电大学硕士研究生学位论文第二章测试设备实现方案及芯片介绍 图2 - 1 系统原理图 是系统的核心部分,负责设备的初始化,配置,性能检测,与外部工作站相通信,由外部 工作站下载语音材料及测试序列并存储到s r a m 中,在测试中控制e 1 接口模块从s r a m 中读取原始语音发送到待测系统同时控制接收失真语音数据并存储到s r a m 中,完成后将 采集到的失真语音文件通过接口送到工作站处理,得出评分值;三是语音数据存储模块, 该部分是负责存储原始语音和设备测试中接收下来的失真语音。四是时钟与电源模块,负 责整个设备的定时与供电情况。 系统原理图如图2 1 所示,其中e l 接口及时钟提取分别采用了加拿大z a r l i n k 公司的 m t 9 0 7 5 b 芯片 2 】及z l 3 0 1 0 0 芯片 3 】,处理控制单元选择的是a t m e l 公司的a t m e g a l 2 8 ( l ) 芯片 1 】,语音数据存储模块则采用了s r a m 。 2 2m c u 的选择 本系统中微控制器m c u ( m i c r oc o n t r o l l e ru n i t ) 选用的是a t m e l 的a v r 单片机 a t m e g a l 2 8 1 。a t m e l 的a v r 单片机是增强型r i s c 内载f l a s h 的单片机,芯片上的f l a s h 存储器附在用户的产品中,可随时编程,再编程,使用户的产品设计容易,更新换代方便。 1 2 南京邮电大学硕士研究生学位论文第二章测试设备实现方案及芯片介绍 a v r 单片机采用增强的r i s c 结构,使其具有高速处理能力,在一个时钟周期内可执行复 杂的指令,故每m h z 时钟速率可实现1 m i p s 的处理能力。a v r 单片机工作电压为2 7 6 0 v ,可以实现耗电最优化。a v r 的单片机广泛应用于计算机外部设备、工业实时控制、 仪器仪表、通讯设备、家用电器、宇航设备等各个领域。 a v r 单片机采用哈佛结构,具备1 m i p s m h z 的高速运行处理能力;采用r i s c ( 精 简指令集) ,具有3 2 个通用工作寄存器,克服了如8 0 5 1m c u 采用单一a c c 进行处理造 成的瓶颈现象;快速的存取寄存器组、单周期指令系统,大大优化了目标代码的大小、执 行效率,部分型号f l a s h 非常大,特别适用于使用高级语言( 如c 、b a s i c ) 进行开发;作 输出时与p i c 的h i l o w 相同,可输出4 0 m a ( 单一输出) ,作输入时可设置为三态高阻抗 输入或带上拉电阻输入,具备1 0 m a 2 0 m a 灌电流的能力;片内集成多种频率的r c 振荡 器、上电自动复位、看门狗、启动延时等功能,外围电路更加简单,系统更加稳定可靠; 大部分a v r 片上资源丰富:带e 2 p r o m ,p w m ,r t c ,s p i ,u a r t ,t w i ,i s p ,a d , a n a l o gc o m p a r a t o r ,w d t 等;大部分a v r 除了有i s p 功能外,还有l a p 功能,方便升级 或销毁应用程序。 a t m e g a l 2 8 为基于a v rr i s c 结构的8 位低功耗c m o s 微处理器。由于其先进的指令集 以及单周期指令执行时间,a t m e g a l 2 8 的数据吞吐率高达1m i p s m h z ,从而可以缓减系 统在功耗和处理速度之间的矛盾。通过将8 位r i s cc p u 与系统内可编程的f l a s h 集成在 一个芯片内,a t m e g a l 2 8 为许多嵌入式控制应用提供了灵活而低成本的方案。a t m e g a l 2 8 a v r 有整套的开发工具,包括c 编译器,宏汇编,程序调试器仿真器和评估板。 。 2 3m t 9 0 7 5 b 及e 1 标准 本系统中原始语音经过e 1 接口进入待测系统,经过系统失真后的语音又经过e l 接口 回到测试设备,所以要了解e 1 接口上的数据码流,并实现发送、接收数据模块的结构设 计。 e l 接口模块的实现采用z a r l i n k 公司的m t 9 0 7 5 芯片 2 实现,m t 9 0 7 5 是一种单e 1 接口,综合了成帧器和l i u ,重要特性包括数据链路接入、告警、中断、环回和诊断,非 常适合本课题中e l 接口模块设计的需要。设计完成后还可以结合此芯片的特点通过对告 警信息的提取并传送到外部工作台而达到对设备的监控。 南京邮电大学硕士研究生学位论文第二章测试设备实现方案及:吝片介绍 2 3 1m t 9 0 7 5 概述 m t 9 0 7 5 b 是加拿大z a r l i n k ( 过去的m i t e l ) 公司的e l 线路接口及成帧器合二为一的 芯片,它的片上线路接口单元l i u 符合并支持最新的3 0 路p c m 以及i s d n 低速率标准, 如c l 7 0 3 ,g 7 0 4 ,g 7 9 6 ,g 7 7 5 ,c t 7 3 2 ,g 8 2 3 和i 4 3 1 。该芯片同样符合并支持e t s ie t s 3 0 0 0 1 l ,e t s 3 0 0 1 6 6 ,e t s 3 0 02 3 3 以及b s6 4 5 0 标准。 m t 9 0 7 5 b 具有在o 时隙自行产生帧同步信号,在1 6 时隙可以采用h d l c ( 高级数据 链路控制) 协议,并且能够自动完成c r c 循环校验的特点,一般用来完成基站与交换中 心的e l 接口。它是一个可以产生并处理p c m 3 0 信号的单片器件,而产生的p c m 信号的 成帧器被连接到一个2 0 4 8 m b p s 的底板上,通过对应于第o 信道( 国内应用比特) 的h d l c 控制器( h d l c 0 ) 和对应于第1 6 信道的h d l c 控制器( h d l c l ) ,它可以提供可选速率 的数据链路接入方式。这个l i u ( 线路接口单元) 把成帧器连接到了带隔离变量器的p c m 3 0 发射器上。其接收部分由一个输入信号峰值检测器,一个可选择的两相的均衡器,一个滤 波器,数据时钟限幅器及一个时钟提取电路组成;传输部分由数字缓冲器,d a 转换器及 一个差分驱动器组成。 m t 9 0 7 5 b 的数字接口连接一个内时分复用p c m 信道产生的输入数据流捌b ! 信迫的 发送负载上,此时接收负载连接在s t - b u s 或g c i2 0 4 8 m h z 底板总线上。线路的控制, 状态报告和训练是通过并行微处理器接口实现的。m t 9 0 7 5 b 的帧算法允许在使用c r c 4 和未使用c r c 4 的e 1 接口之间实现自动工作模式切换。 m t 9 0 7 5 b 通过软件控制可以在终端或透明状态下操作。在终端( t e r m i n a t i o n ) 模式下, c r c 4 运算是帧算法的一部分。在透明传输模式下,从d s t i 上传来的数据可以没有帧或者 信令,另外,m t 9 0 7 5 b 允许数据连接保持透明,采样和信令数据都可以在不被更改的前提 下通过该设备,该特性对于p c m3 0 链路的中间设备十分有用,特别是c r c 4 传输的错误 信息必须通过最后的终端来校验。在透明接收模式下,接收到的线路数据进入d s t o 。 m t 9 0 7 5 b 能全面适应各种情况,报警,管理操作和特征报告。这些包括b p v s 计数器, c r c 错误计数器,e 比特错误计数器,帧头信号错误计数器,b e r t 计数器,r a i 和连续 c r c 错误计数器。同样也包括针对b p v s ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论