（语言学及应用语言学专业论文）普通话水平测试评分系统的语图识别研究.pdf

上传人：伐*** IP属地：宁夏上传时间：2019-12-07 格式：PDF 页数：131 大小：9.73MB 积分：0 举报 版权申诉

（语言学及应用语言学专业论文）普通话水平测试评分系统的语图识别研究.pdf_第2页

（语言学及应用语言学专业论文）普通话水平测试评分系统的语图识别研究.pdf_第3页

（语言学及应用语言学专业论文）普通话水平测试评分系统的语图识别研究.pdf_第4页

（语言学及应用语言学专业论文）普通话水平测试评分系统的语图识别研究.pdf_第5页

已阅读5页，还剩126页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

内容摘要本文是以我的导师王渝光教授领导的2 0 0 3 年国家语委语言文字应用“十五”科研规划重点项目一“普通话水平测试研究”( z d i1 0 5 1 8 ) 子课题“计算机辅助普通话水平测试评分系统研究”( z d i1 0 5 1 8 2 4 ) 为主，力求通过对大量发音材料进行对比分析，达到对普通话水平测试评分标准做更为明确、清晰的正确、错误、缺陷界定。本文选取了试卷号为g t l 的国家普通话考试卷子中赵廷、从贵读单字、词语、句子部分的语音材料，参考实验语音学的理论依据和研究成果，使用 s p e e c ha n a l y z e r 软件绘制w a v ef o r m ( 音波图) 、c u s t o mp i t c h ( 音高图) 、 s p e c t r o g r a m ( 语图) ，并在此基础上进行详细、深入地分析，以求在进行普通话水平测试评分的过程中，科学、客观地界定每个音的正确、缺陷和错误，在今后的普通话水平测试评分中最大限度的避免测试的主观性，有效提高普通话测试质量。关键词：普通话测试标准识别分析 t - 毫 a b s t r a c t t h et h e s i si sc e n t e r e da ts t u d yo ng r a d i n gs y s t e mf o rp u t o n g h u at e s t m a d eb yc o m p u t e r , as u b s u b j e c tu n d e rr e s e a r c ho nt h ep u t o n g h u at e s t ，a n i m p o r t a n tp r o g r a mt h a ti si n c l u d e di nt h e “t e n t h5 一y e a rp l a n ”f o r s c i e n t i f i cr e s e a r c h o na p p l i c a t i o no fl a n g u a g ef o rs t a t el a n g u a g ec o m m i s s i o no fc h i n af o r2 0 0 3l e d b ym yt u t o rp r o f e s s o rw a n gy u g u a n g t h et h e s i sa i m sa t t h er e a l i z a t i o nf o rt h e c l e a ra n da c c u r a t ej u d g m e n t so nc o r r e c t n e s s ，w r o n g n e s sa n dd e f e c t sf o rg r a d i n g s t a n d a r df o rp u t o n g h u at e s tb yt h ec o m p a r i s o na n da n a l y s i s o nn u m e r o u s p r o n u n c i a t i o n m a t e r i a l s t h et h e s i ss u b t r a c t st h ep r o n u n c i a t i o nm a t e r i a l sf r o mn a t i o n a lp r o f i c i e n c y t e s to fp u t o n g h u ap a p e rn o g t l t h ep r o n u n c i a t i o nm a t e r i a l si n c l u d ew o r d s ， p h r a s e sa n ds e n t e n c e sm a d eb yz h a ot i n ga n dc o n g g u i t h et h e s i sr e f e r st ot h e t h e o r yr e a s o n i n ga n d r e s e a r c hc o n c l u s i o nf o re x p e r i m e n tp r o n u n c i a t i o n s t h e t h e s i sa d o p t st h ec o m p u t e rp r o g r a ms p e e c ha n a l y z e rt od r a ww a v ef o r m ，c u s t o m p i t c ha n ds p e c t r o g r a ma n dm a k e sd e t a i l e da n a l y s i so nt h e m t h et h e s i st a r g e t st o j u d g e t h ec o r r e c t n e s s ，w r o n g n e s sa n dd e f e c ts c i e n t i f i c a l l yd u r i n gt h eg r a d i n g p r o g r e s so fp u t o n g h u at e s t ，w h i c hw i l l a v o i dt h es u b j e c t i v i t yt ot h em a x i m u m w h e ng r a d i n gf o rp u t o n g h u at e s ta n di m p r o v e st h eq u a l i t yo fp u t o n g h u at e s t e f f e c t i v e l y k e y w o r d s ：p u t o n g h u a t e s t s t a n d a r dr e a l i z a t i o n a n a l y s i s 8 第一部分“普通话水平测试评分系统”总论一、论文的提出与立项中华人民共和国宪法规定：“国家推广全国通用的普通话。”2 0 0 1 年1 月1 日开始施行的中华人民共和国国家通用语言文字法第十九条规定：“凡以普通话作为工作语言的岗位，其工作人员应当具备说普通话的能力。以普通话作为工作语言的播音员、节目主持人和影视话剧演员、教师、国家机关工作人员的普通话水平，应当分别达到国家规定的等级标准：对尚未达到国家规定的普通话等级标准的，分别情况进行培训。”第二十四条规定：“国务院语言文字工作部门颁布普通话水平测试等级标准”。这些法律文为普通话水平测试奠定了坚实的法律基础。1 9 9 4 年l o 月国家三部委颁布了关于开展普通话水平测试工作的决定和普通话水平测试等级标准( 试行) ( 下简称标准) ，有关部门发布了普通话水平测试大纲 ( 下简称大纲) 。普通话水平测试是一个新兴的较为复杂的语言测试系统工程，既需要宏观的政策导向和理论指导，也离不开微观的调查研究和实验分析，大纲和标准作为指导我国普通话水平测试的总纲，在实施过程中，具有明确的导向作用，为普通话水平测试工作的开展，发挥了不可替代的指导作用。普通话水平测试是贯彻中华人民共和国国家通用语言文字法的重要内容，是使推广普通话工作逐步走向科学化、规范化、制度化的重要举措。自普通话水平测试工作开展以来，国家、地方的各级语委和普通话培训测试中心做了大量的工作，积累了许多宝贵的经验，同时也遇到了很多亟待解决的理论和实践方面的问题。这些问题如不及时解决，就可能造成各地测评出来的普通话等级水平并不等值，从而在不同程度上影响普通话水平测试测试的客观性和可比性，影响国家法定部颁标准的科学性和权威性。为了在今后的普通话水平测试评分中最大限度地避免评分的主观性，加强和维护普通话水平测试国家法定标准普通话水平测试等级标准的客观性、准确性、权威性，有效提高普通话质量，我导师王渝光教授领导了国家语委文字应用“十五”科研规划重点项目“普通话水平测试研究”的子课题“计算机辅助普通话水平测试评分系统研究”的研究工作，我有幸参与了课题基础层面“普通话水平测试评分系统”数据库的建设，内容包括：1 、采集语音样本。2 、测量语音数据。绘制字、词、句的语音声学音波图( w a v ef o r m ) 、音高图( c u s t o m p i t c h ) 、语图( s p e c t r o g r a m ) 。3 、分析语音数据，确定正确、缺陷和错误标准。根据分析、确定的语音规范样本和声学规范数据，通过m i c r o s o f tv i s u a lf o x p r 0 6 0 软件建立普通话水平测试评分系统多媒体语音声学数据库。并将此作为论文选题的依据。 9 二、论文研究的内容和意义 “普通话水平测试评分系统的语图识别研究”的研究内容分为三大部分：普通话单字库语图的识别研究、普通话词语库语图的识别研究和普通话句子( 朗读部分) 库语图的识别研究。 ( 一) 实验语音学研究实验语音学研究时数据库建设的基础，它为数据库提供基本的语言材料和分析数据。 ( 二) 数据库建设数据库建设综合、归纳、展现实验语音学的研究成果，指导普通话水平测试评分的实践工作。“普通话水平测试评分系统”属于自然语言信息处理系统。该系统研究的问题主要包括两个方面：l 、语言信息本身，即通过对语言特征的分析、判定与识别，取得相关语言数据，建立普通话水平测试各等级标准语言特征数据库；2 、语言信息的应用，即设计应用该数据库各有关信息，完成特定任务的计算机程序与程序的整合。关于第一个方面语言信息本身，我们通过对语言特征的分析、判定与识别，取得相关数据，建立普通话水平评分系统数据库内容如下：普通话水平测试评分系统数据库下含单字库、词语库、句子库( 朗读部分) 等。三个库皆包含两位普通话水平分别为一级乙等、三级乙等( 以下简称一乙、三乙) 男士的发音材料，材料由声音、语图数据组成，并有配套的对读音正确、错误、缺陷的文字分析与评判。关于第二个方面语言信息的应用，即设计应用该数据库各有关信息，完成特定任务的计算机程序与程序的整合。计算机程序与程序整合的设计采用v i s u a lf o x p r 0 6 0 语言，设计表单，建立完整的应用程序，发布应用程序。利用该数据库，拟完成的任务有：1 、通过表单，客观展现语音的声音形象和语图的图形形象，并以此分析得出各种有关数据，为普通话水平测试评分提供客观具体的语言样本和科学、客观的语言学、言语声学和实验语音学数据；2 、通过有关各库，为普通话测评员提供普通话水平测试评分的语音样本，提供准确评判有关字词、朗读材料的有关数据、语音样本的评判标准，有效地指导测评工作，提高评判水平，提高测评员的测试信度；3 、通过有关各库，为各普通话教师的教学提供普通话水平测试评分的语音样本，提供准确区分有关字词材料、朗读材料的语音样本、有关数据和评判标准，循序渐进、因材施教，以便有效地有针对性地指导普通话学习，提高教学质量。4 、为语言研究工作者提供客观真实的语言分析研究材料和有关数据，利用先进的研究手段，提高普通话的研究水平。本文的理论意义在于借助先进的语音研究手段，将传统语音学和现代科学技术紧密结合起来，将汉语语言学的基础研究与汉语普通话水平测试应用研究紧密结合起来，验证、丰富、补充、完善传统汉语语言学的内容，为汉语语言学研究的现代化提供新的研究理论和方法，促进汉语语言学的发展。本文的应用价值在于为普通话水平测试评分提供准确、科学、客观的语音样本和具体声学数据，最大限度地避免普通话水平测试的主观性，有效地提高普通话测评质量，这对于促进推广普通话工作的深入开展，提高汉语在国际上的地位，有着良好的社会效益。测评质量的提高，测评客观性、准确性和权威性的加强，将吸引国内外更多的各类人员参加普通话水平测试，这 1 n 也将产生出巨大的经济效益。第二部分语音的声学特征和正误辨析原则、元音的声学特征和正误辨析的原则和方法 ( 一) 元音声学特征分析的原则和方法从声学的观点看，元音的声学特征是这样产生的：人肺部呼出的气流是发音的动力，声带是发音体，气流经过的通道( 包括喉腔、咽腔、口腔、鼻腔、唇腔) 构成了一个具有自然频率的共鸣器，叫做声腔。元音的音色由声腔的共振决定。发音时首先声带振动，产生声带音，同时软腭和小舌上升，挡住了通往鼻腔的通路，使声带音只能从口腔出去。口腔是人类发音器官中最重要的部分，发音活动的一切复杂变化都在口腔里进行，唇、舌、软腭和小舌的活动可以改变口腔的形状、容积和气流的通路，使声带音产生种种不同的共振，形成了不同的元音音色。在口腔的调音作用中，最活跃、最积极的是舌头，舌位的前后( 舌高点至门齿的距离) 、高低( 舌高点处上颚与舌背的距离) 对元音的不同有着直接的关系。元音发音时唇形的变化( 唇形的开合度、唇形面积) 对口腔形状的变化也起着很大的作用。唇开度时双唇垂直维上的距离，距离大说明上下唇的开度大，距离小就是开度小。展唇元音的开度大于圆唇元音。唇形面积是发元音时上下唇张开的面积。舌位高度相同的元音，展唇元音的面积大于圆唇元音。共振峰是声腔的共鸣频率，通常是指以声带振动为声源、有严整谐波结构的元音和响辅音。就元音来看，前两个共振峰f 1 、f 2 对元音音色有质的规定性，观察f l 、f 2 模式的变化，就可以确定元音的音质变化。所以在语音学上常以f l 、f 2 的数值作为描写元音音色的依据。传统语音学对元音的描写主要有舌位的高低、前后，唇形的圆展等方面。实验证明，舌头是发音器官中最机动的部分。舌头的高低前后固然是影响元音的主要因素，就是舌尖后面的平与卷，或凹与凸的程度也对元音有影响。此外，另一个影响元音的重要器官是唇。实验证明，两唇之间上下距离，或两唇角左右距离的变动( 唇的开度和展度) ，都对元音有影响。总的来晚，口腔各部分器官位置、形状的变化，都会改变共鸣腔的形状，对元音音色都有影响。除此之外，如果发元音时软腭下垂，使一部分气流通过鼻腔出来，就会使元音带有鼻化音色。在实际交际中，听话者并不是从元音的生理描写而是从元音的声学特征去感知不同的元音的。因而元音的声学分析极为重要。元音的声学特征主要表现为元音的共振峰模式。元音声学特征的分析原则就是分析元音的共振峰模式。其中，第一共振峰f 。和第二共振峰f 。对区分不同的元音有着重要的作用。在频谱图( s p e c t r u m ) 上，f l 和f 2 的共振峰值一般可以把不同 1 1 元音之间的差别反映出来。也就是说，每一个元音都可以由两个共振峰值来画出频谱。丙在语音学上正是参考这些频谱图形来进行元音识别和分析的。由于频谱图是二维的，不能有效地显示时问变化时频谱变化的情况，因而一般采用具有三维特点的语图( s p e c t r o g r a m ) 来分析元音共振峰频率的变化模式。语图的共振峰频率频带较宽，不如频谱图直观，识图有定难度，一般取中心值。元音的音色是由声腔的共振决定的。发元音时首先声带颤动，产生声带音，同时软腭和小舌上升，挡住通往鼻腔的通路，使声带音只能从口腔出去。口腔是人类声腔中最灵活富于变化的部分，口腔的每一个细微的变化都会对声带音的共振产生影响，形成不同的音色。分析元音最主要就是分析f l 和f 2 之问的关系模式。根据f 1 和f 2 之间的关系绘制而成的声学元音图，与传统语音学的元音舌位图有着异曲同工之处，可以相互印证，其关系为： f 1 频率的高低同嘴唇的开口度直接相关。频率越高，开口度越大：频率越低，开口度越小。某男性省级测评员i 、u 、u 、a 、o 、e 的语图( 图2 7 1 ) 如下： a 的f 1 在8 0 0 h z 以上，而且a 的开口度是六个基本元音中最大的，其次是o 、e 、u 、u 、 i ，其i 的f 1 最低，约在2 5 0 h z 左右，i 的开口度也是最小的。由此可知，f l 与下颌开度成正比。开口度越大，f 。频率越高；开口度越小，f 。频率越低。 luuaoe i 、u 、n 、a 、o 、e 、波形图、语图( 图2 - i ) 开口度与舌位的高低密切相关，因而f 1 也与舌位高低密切相关。在这六个单元音中，舌位最低的是a 。舌位最高的i 、u 、u ，o 是半低元音，e 是半高元音。舌位高，f 1 频率就低；舌位低，f 1 频率就高。 f 2 主要反映舌位的前后变化，它的降低同舌位的后缩直接相关。舌位靠前，f 2 频率就高：舌位靠后，f 2 频率就低。在舌面前e 、舌面央e 、舌面后e 的某女性省级测评员语图( 图2 2 ) 中，由于发音时的舌位分别是靠前、居中和靠后的，三个元音的f l 依次由前向后逐渐降低，由于本来已经很低，因而变化不是很明显。相比之下，f ：的变化十分明显。前e 的f 2 最高，约在2 0 0 0 h z 左右，央e 的f 2 稍低，约在1 5 0 0 h z 之间，后e 的f 2 最低，约在1 2 0 0 h z 左右。值得注意的是三个 e 的f 3 基本没变化，在2 6 0 0 h z 左右。逐渐降低，由于本来已经很低，因而变化不是很明显。相比之下，f 2 的变化十分明显。前e 的f 2 最高，约在2 0 0 0 h z 左右，央e 的f 2 稍低，约在1 5 0 0 h z 之间，后e 的f 2 最低，约在1 2 0 0 h z 左右。值得注意的是三个e 的f 3 基本没变化，在2 6 0 0 h z 左右。舌面前e舌面央e舌面后e 舌面前e 、舌面央e 、舌面后e 波形图、语图( 图2 2 ) 同样，在舌面前a 、舌面央a 、舌面后a 的某男性省级测评员语图( 图2 3 ) 中，前a 、央 a 、后a 的f l 与f 2 较为重合，有顺次下移的趋势。其语图表现出f 2 与舌位前后关系密切，前元音f 2 高，后元音f 2 低。 a a n 舌面前g 、舌面央a 、舌面后。波形图、语图( 图2 - 3 ) 1 3 另外，f 2 与圆唇也有关。双唇突出拢圆，实际上就是使声腔延长了，其声学效果表现为 f 2 频率下降。唇越圆，f 2 越低；唇越扁，f 2 也越高。在图2 1 语图中，i 与u ，e 与。的比较也充分证实了这一点。分析f 1 与f 2 的高低升降变化的模式是元音声学特征分析的基本方法。此外，还可以从声音的强弱方面来考察元音的声学特性。发元音时，声带振动，发音器官各部位均衡紧张，气流在经过声道时不受阻碍，从语音的物理性质来看，元音是有规则的音波，属于乐音。表现在音波图( w a v ef o r m ) 上，元音的波形皆体现了元音振幅不断增强，当到达某一顶点时逐渐减弱的变化模式。元音的波形曲线包络非常齐整，表明发音器官所完成的各次振动有着内在的协调性。人们在分析复韵母时，观察各元音的波形曲线就可以掌握发音能量的强弱变化情况，并结合元音的共振峰语图模式，对复韵母发音的正确、错误、缺陷进行准确判断。复韵母是由二合元音或三合元音构成的韵母。在二合元音中，i a 、u a 、u o 、 i e 、u e 是后响二合元音，因为它们的开口度都是从小到大的，所以发音强度也从弱到强，后一个元音的波形曲线包络面积必然大于前一个元音。在前响二合元音a i 、a o 、e i 、o u 中，其开口度是由大到小的，发音强度也从强到弱，前一个元音的波形曲线包络面积大于后一个元音。三合元音i a o 、i o u 、u a i 、u e i 的波形曲线包络与单个元音非常相似，也是一个振幅不断增强，然后再逐渐减弱的变化模式。 ( 二) 元音正误辨析的原则和方法由于人们的发音器官不可能完全相同，同元音对不同的个人来说，具体数据是不会完全相同的，但它有一定的变化范围和一定的表现模式，只要在可允许的模式和范围内，不同的发音都应该认为是正确的。超出此范围，就应该判为缺陷，超出的范围过大，已经进入到别的音素的范围，则读音错误。这个范围对不同的音素来说，情况是不一样的。元音正误辨析的方法就是针对不同的具体音素，通过实验，在相邻音素间划出正确音、缺陷音的最大可允许的范围和具体识别模式。从声学角度对元音正误的辨析，主要应掌握以上的元音声学特征的分析原则，通过实验，正确界定正确音可允许的范围和缺陷音的最大范围。以图2 3 的舌面前a 、舌面央a 、舌面后 a 为例，这三个a 在普通话语音系统中均为同一音位的条件变体，从音位理论的角度来看，三个a 的混读，可视为缺陷。从声学特征的角度来看，它们的f l 与f 2 较为重合，有顺次下移的趋势。f 2 频率上、下限的可变范围值一般在1 2 0 0 8 0 0 h z 之间。舌面前a 为1 2 0 0 h z ，舌面央a 为1 0 0 0 h z ，舌面后a 为8 0 0 h z 。我们就可以以2 0 0 h z 为正确音的最大可允许范围，以 2 0 0 h z - - 4 0 0 h z 为缺陷音的最大可允许范围，超过4 0 0 h z 的音则为错误音。由于0 音的f 2 在 6 0 0 h z 左右，下限范围有限，正确音、缺陷音、错误音的下限范围应相对缩小，具体数值不应进到另个音的范围。对后a 与0 的区别而言，f 2 的下限范围，正确音应为l o o h z ，缺陷音 1 0 0 1 5 0 h z ，大于1 5 0 h z 则为错误音。从图2 - 1 、2 - 3 的语图可以看出，后a 与0 的区别还在于 f 3 ，三个a 的f 3 从3 2 5 0 h z - - 2 5 0 0 h z - - 2 0 0 0 h z 依次也往下掉，而0 的f 3 不明显约在2 2 5 0 h z 处。故语图的共振峰模式的识别有时不能只看f 1 、f 2 。 1 4 同样，根据图2 2 舌面前o 、舌面央e 、舌面后e 的语图可以确定，前e 的f 2 的正确音的可变范围为2 0 0 0 h z ，3 0 0 h z ，缺陷音的可变范围为3 0 0 h z 一5 0 0 h z 。央e 的f 2 的正确音的可变范围为1 5 0 0 h z ，2 0 0 h z ，缺陷音的可变范围为2 0 0 h z 一3 0 0 h z 。后e 的f ：的正确音的可变范围为1 2 0 0 h z ，l o o h z ，缺陷音的可变范围为1 0 0 h z 一2 0 0 h z 。根据大多数测评员的测评结果，综合上下限音，我们可以大体判定，f 2 范围在1 0 0 一2 0 0 h z 以内变化的，计为正确。超过此范围，在2 0 0 - - - 3 0 0 h z 以内均计为缺陷，而超过此范围太大( 3 0 0 h z 以上) 的，可计为错误。介于相邻两个音位之问的语音数据，可以计为缺陷。计错的标准为一个音的数值已经进到另一个音数值的范围。就正确音、缺陷音而言，共振峰频率上限变化的范围可以大一些，频率下限变化的范围必须小一些。前元音的变化范围可以大一些，后元音的变化范围必须小一些。不圆唇元音的变化范围可以大一些，圆唇元音的变化范围必须小一些。这些就是元音正误辨析的基本原则。元音正误辨析的原则还有一个共振蜂模式的问题。不同的元音有不同的共振峰模式。需要注意的是，男声的共振峰绝对频率偏低，女声的共振峰绝对频率偏高，但它们形成的共振峰模式的总态势不变，f l 和f 2 的相互关系不变，这与声调调值的相对音高情况相似。二、辅音的声学特征和正误辨析的原则和方法 ( 一) 辅音声学特征分析的原则和方法辅音在语音学中的一般定义是，有阻碍的音就是辅音。发辅音时，既有不同的阻碍部位，又有不同的阻碍方式，还有清浊、送气和种种附加音的分别，可以说把人类所具备的发音能力全部用上了。因为口腔中有了阻碍才有辅音，所以这个阻碍决不是停留不动的，必须放开或松开才能成音。一般叫做“除阻”。因此构成辅音的特点首先是有阻碍，然后是有动程，即随时间而变的音。这就决定了辅音的声学特征比元音复杂得多，每一个辅音都由好几个方面的声学特征组成，组成的模式不但多样化，而且不大稳定，在语图上辨认辅音比元音困难得多。辅音的声学分析主要是把它的声学特性如音色、音高、音强、音长四种要素的参量，借助仪器设备和耳听的观察验证，做出判断和比较。声学分析同生理分析是相辅相成的。生理分析从声腔内部的器官和肌肉等活动现象、显示出辅音的发音部位和发音方法。声学分析则是从声腔外部由空气中传导的声波来提取参量，作片段的和整体的测量，并加以综合研究。如果说生理分析的对象是语音发出之前的现象，主要揭示了调音的部位，声学分析对象则是语音发出时一系列过程的现象。从辅音声波的不同性质，如周期性波为乐音性质的浊辅音，无规非周期性波为噪音性质的清辅音等，反映出辅音的发音方法。同时，从辅音频谱的能量分布区域( 强频集中区) ，也可以反映出它的调音部位。辅音的发音方法和声源的性质密切相关，方法的不同只不过是三种声源浊音( 声带音) 、瞬音和紊音的不同或组合方式的不同。一 1 s 冲直条：发音器官某个部位形成完全的堵塞，然后气流猛然冲破阻碍，形成一发即逝的瞬音，也就是爆发成声的塞音。塞音在语图上的表现是一根整齐的陡然向上的直线，叫冲直条。它反映出气流在冲破阻碍的一瞬间，声带突然释放的瞬态噪音。瞬态噪音表示表示短暂的爆发音段。 k p 、t 、k 波形图、语图( 图2 - 4 ) 图2 - 4 为普通话p 、t 、k 的波形图、语图。p 是双唇送气清塞音，t 是舌尖中送气清塞音， k 是舌面后送气清塞音。在波形图上，三个辅音在爆破后均有一段1 0 0 毫秒左右的持续湍流。在语图上，三个音表现为明显的冲直条与噪音乱纹。p 的冲直条在约o 3 秒处出现，t 的冲直条在约1 6 秒处出现，k 的冲直条在约2 8 秒处出现，都持续仅仅1 0 毫秒左右。乱纹：紊音是由于气流通过狭窄的缝隙而产生的，擦音就属于紊音。由于发音时气流受到阻碍，不能畅通，在窄缝中形成不规则的持续湍流，在语图上就表现为一簇纵向杂乱的条纹，就叫做乱纹。表示延续的噪音段( 如f 、x 、s 等音) 。与塞音相比，擦音是长音，所以在语图上的横轴上时间可达1 0 0 多毫秒。这在擦音x 、s 的波形图、语图上可以观察到( 见图2 5 ) 。 x x 、s 波形图、语图( 图2 - 5 ) 1 6 s x 是舌面前清擦音，s 是舌尖前清擦音。在x 、s 的波形图( 图2 5 ) 中，可看出在两个辅音前的持续时间较长的摩擦段，表示了在发音时，在两个发音部位间形成窄缝，让气流摩擦而出，产生摩擦湍流。其中，x 的摩擦湍流气流较为急促，显示在波形图上为尖锐的波形。x 的乱纹约持续2 5 0 毫秒；s 的乱纹约持续2 1 0 毫秒。时间都较长。在语图显示上，乱纹非常明显，因为湍流较急，x 的乱纹的能量较强，冲直条从2 0 0 0 h z 开始，在5 0 0 0 - - 6 5 0 0 h z 之间形成强频区，并持续向上至7 0 0 0 h z 以上。s 的乱纹从约4 5 0 0 h z 开始，在约5 5 0 0 8 0 0 0 h z 形成能量集中区，但较弱。乱纹起始频率与乱纹的强频区频率范围，是识别辅音的重要语音特征。横杠( 宽横杠) ：浊音是由声带有规律颤动而产生的，它是表示辅音声带颤动的浊音段( 如 m 、n 、z 等音) 。凡出现浊音( 声带音) 时语图的频率低端上都会有浓黑的宽横杠，但是代表辅音中浊音成分的宽横杠和代表元音共振峰的横杠，在语图上的表现很不相同。浊辅音的浊音成分和摩擦噪声是混同出现的，也就是乱纹中夹着宽横杠，浊音横杠出现在贴近基频的部位，在其上有噪音乱纹。而元音横杠表示的第1 共振峰一般离基频较远。鼻音的浊音横杠上还有明显的共振峰。如i l l 、r 的波形图、语图( 图2 6 ) 。 m 、r 波形图、语图( 图2 6 ) m 是双唇浊鼻音，在波形图上可以看出在发音时，口腔上下两个发音部位完全闭塞，同时软腭下降，让气流从鼻腔中出来，形成了约1 5 0 毫秒的鼻音阻塞。表现在语图上就是在浊音横杠上还有共振峰，并夹杂有乱纹。r 是舌尖后浊擦音，兼具元辅音两种特征。在波形图上看，较为接近元音。从语图上看，从l o o h z 开始有横杠出现，持续约1 l o 毫秒后与元音共振峰相衔接。横杠的特点是带有乱纹。乱纹逐步地自然地演变为共振峰。各个辅音有不同的调音作用，各种辅音的语图描写模式都是由三种基本纹样单独或混合出现所组成的。在实际的语言中有更多的变化。从常见的辅音模式中，可以得知：凡是清音都是一种脉冲似的冲直条或一片乱纹，凡是浊音都有横杠。辅音的声学特征基本上反映了生理的发音部位与方法。发音方法可以由语图的三种基本纹样来表达，而发音部位则可以由噪 1 7 音的强频区的频率分布来决定。强频集中区是指发辅音时由于空气湍流而形成的能量集中强频区。辅音是非周期波，它是由许多杂乱无章的声波混合组成的，并不按照一定的周期重现前一个波形，所以爆发成声或摩擦成声时不会在语图上形成一道宽横杠，只是表现为一簇簇较明显的噪音乱纹，这就是辅音能量增加时的强频集中区。不同的声腔阻碍，产生的空气湍流也不一样，就会表现为不同的强频集中区。由于阻碍部位的不同，辅音的强频集中区就会出现在不同的频率位置，并且强频区频率范围的大小也各不相同。通过强频集中区在语图中频率坐标上显示出来的不同位罱，就可以判定辅音的发音部位。强频集中区的频率越高，声音越尖；频率越低，则声音越低。发辅音时发音部位的变化也是声腔形状的变化，也同样能形成不同位置的能量集中区或强频区。只是辅音主要依靠阻碍而不是依靠共振发音的，除鼻音和边音外，不可能形成元音那样的共振峰，一般只是在一定的频率位出现一片强频区，强频区的强弱和聚散都能表现出发音部位的变化。声学分析发现，强频区下限的频率位置与舌位前后有关，舌位越前，下限越高。有时舌位前后移动虽然很小，但频率范围的下限会发生明显变化。例如，在普通话里的s 是舌尖前音，它的强频区下限频率通常在2 5 0 0 h z 左右，而舌尖后音s h ，从发音部位来说，舌头位置差别很小，可是它的下限频率却很低，通常在1 6 0 0 h z 左右。实验语音学从听辨角度发现，辅音的音色光靠辅音本身的声学特征是难以辨别的，比如普通话里的不送气清塞音，它的爆发成声的除阻段，一般只有l o 毫秒左右，时长太短，就不容易听清楚甚至昕不清楚是什么音，所以绝大部分辅音都要带上一个元音才能形成清晰的听觉上的区别。从声学角度看，一段语音的声波是个连续的过程，所包括的各个音并不是离散的序列，而是连续不断相互影响的，各个音的声学特征都会对它前后的音产生影响。过渡音征( t ) 的产生，从生理上说，是反映了发音器官从辅音过渡到元音的运动过程；从声学上说，由于辅音对邻接元音的影响，使共振峰起始部分的频率发生了变化。过渡音征对辅音的调音部位，特别是对暂音的部位在昕辨上有决定性作用。辅音的听辨，主要靠它在时变程序上的声学特征信息起作用。t 的走向反映出辅音的调音部位( 主要的) 和发音方法( 次要的) 。由于不同的辅音有不同频率的能量集中区( 发音部位) ，而元音又有自己特定的共振峰频率，因此不同的辅音与同一个元音结合时，或者同一个辅音与不同的元音结合时会产生不同的过渡音征。它是元音和辅音结合时，辅音寄生在元音上时的声学特征，它对辅音的昕辨起着征兆的作用，所以叫做音征。音征主要有升渡( 正渡) 、降渡( 负渡) 和平渡( 零渡) 三种类型。音征的主要信息寄生在元音的f 2 上，f l 的音征走向虽然也与发音部位有关，但不是主要的。一般来说，除鼻音外，f 1 的音征走向总是升的，因为辅音除阻时开口度总是从小到大的，与之相应的f l 其频率也就由低到高。从f 2 来说，大体上双唇的音征走向都是升的，舌尖音、舌根音则都是降的，只不过舌根音降的幅度更大。辅音各个不同频率的音征走势集中指向同一音轨，这个音轨的频率基本上就是指向辅音的强频集中区。可从音轨的位置大致可以推断辅音的调音部位。辅音的不同发音部位有不同的音轨频率，1 8 0 0 h z 是舌尖辅音的音轨频率，各元音的f 2 、f 3 都指向这个频率，形成语图中共振峰横杠开头的弯头，成为元音前面是舌尖辅音的音征。舌根辅音的音轨频率在3 0 0 0 h z 左 1 8 右。音征的不同指向是可以确定前面辅音的发音部位的，这个指向是昕辨辅音的重要信息。在语图上所显示的音征大都是不清晰的，但已可以根据共振峰横杠弯头的指向确定辅音的大致发音部位。音征的发现和音轨频率的确定对推动人工合成语音工作起了很大的作用。嗓音起始时间( v o i c eo n s e tt i m e ，简称v o t ) ：也称浊音起始时间，是辅音和元音连接时发音器官交替活动，即除阻开始与声带颤动开始的时间过程。它主要指塞音除阻和声带颤动之问的时间关系，能比较精确地说明塞音的清浊和送气的情况。v o t 决定一个辅音的清浊、送气，以及不同语种中对应音位问的微小区别、个人发音习惯的特点等。它对识别短暂辅音的发音方法起着主要作用。v o t 前于除阻时间( ( 长于) 送气塞擦音qc hc 送气塞音ptk 不送气塞擦音jz hz 不送气塞音dbg 。与辅音的语图相对，其w a v e f o r m ( 音波图) 也能反映出各个辅音的一些不同的特点。由于浊擦音、边音和鼻音的音波图模式与单个元音的模式非常相近，以下只晚明塞音、擦音、塞擦音的音波图模式。发塞音时，发音部位完全闭塞，堵住气流，然后突然打开阻碍，使气流迸裂而出，爆发成声；其音波图显示在非常短的时问( 小于或等于2 毫秒) 内振幅就到达了顶点，同样在很短的时间内( 约3 毫秒) 振幅降到了一个最低点；因为持续时间短，波形很像一根直立的尖刺。发擦音时，发音部位不完全闭塞，构成气流阻碍的上下两个部分之间留出一条窄缝，使气流从中挤出，摩擦成声：其音波图显示振幅经过一段时间( 约1 5 毫秒) 到达顶点，然后逐渐减弱。由于发音器官各部分紧张不均衡，振动不规则，每次振动幅度的协调性不够，表现在音波图上整个波形曲线包络出现许多长短不一的尖刺。发塞擦音时，发音部位先完全闭塞，堵住气流，然后打开一条窄缝，气流从中挤出。其音波图模式综合了塞音和擦音的特点：首先振幅在非常短的时间( 小于或等于2 毫秒) 内到达顶点，然后逐渐减弱，在减弱的过程中各次振动因协调性不够出现很多长短不一的尖刺。 ( 二) 辅音正误的辨析原则和方法对辅音的生理分析，定性方面的正确、错误和缺陷的判定可以主要依照普通话水平测试大纲的有关规定，而声学特征方面的正误界定主要依据语图，它为辅音的发音方法提供了可以用肉眼看到的声学特征，同时还证实了些光从发音生理很难确定的语音事实。所以在在进行辅音正误界定的时候，要依据实验语音学提供的客观数据。辅音正误辨析的方法是：针对不同的具体音素，通过实验，在相邻音素间翊出正确音、缺陷音的最大可允许的范围和具体识别模式。这里以判定平翘舌组z h 、c h 、s h 、r 和z 、c 、 s 的例子( 图2 - 8 ) 来说明。 x 光动态摄像表明，普通话舌尖后音声母z h 、c h 、s h 、r 的发音部位并不像有的人想象的那样把舌头卷得很厉害，而是舌头向上翘起，舌尖接近硬腭前部同时略为向后缩。这些音的感觉上是卷舌，实际上舌尖并未卷起，只是向上抬高。把舌头卷起得过分，反而不像普通话的舌尖后音。 cs z h 、c h 、s h 、r z 、c 、s 波形图、语图( 图2 8 ) 2 0 出此可见，z h 、c h 、s h 、r 是由舌尖与齿龈后、硬腭前的交接点构成气流阻碍而发出的音；z 、c 、s 是由舌尖与上齿背构成气流阻碍而发出的音。从波形图( 图2 8 ) 上看，z h 、c h 、 s h 和z 、c 、s 自u 均有成阻除阻的摩擦段，不送气音、送气音、擦音特征明显。r 摩擦较小，较为接近元音。从语图上看，z h 、c h 、s h 、r 的语图颜色较深，能量较强；z 、c 、s 语图颜色则较浅能量较弱。z h 、c h 、s h 噪音乱纹的强频区范围在2 0 0 0 h z - - 8 0 0 0 h z ，z 、c 、s 的强频区范围在5 0 0 0 h z - - 8 0 0 0 h z 。根据强频区的频率范围就可以确定z hc hs h 与zcs 的区别。另外，z hc h s hr 与zc s 的后续元音也明显地提供了区分它们的语音特征。根据图2 - 8 ，具体数据整理如下： i 比较的后续元音 f 1f 2f 3 z h ic h is h ir i3 0 0 h z2 0 0 0 h z3 0 0 0 h z z 1c 1s 13 0 0 h z1 6 0 0 h z3 0 0 0 h z 两组音的区别在f 2 。z h ic h is h ir i 的f 2 同时也是强频区下限频率的起点，z ic is i 的f 2 是乱纹的起点，以上逐渐加强，但绝不是强频区的起点。根据波形图和语图，从强频区来看，z h i 组正确音下限频率的可变范围为2 0 0 0 h z ， 2 0 0 h z ，z i 组正确音下限频率的可变范围为5 0 0 0 h z ，4 0 0 h z 。z h i 组缺陷音下限频率的可变范围为：+ 2 0 0 h z 至5 0 0 h z ，- - 2 0 0 h z 至3 0 0 h z 。z i 组缺陷音下限频率的可变范围为：+ 4 0 0 h z 至8 0 0 h z ，- - 4 0 0 h z 至6 0 0 h z 。如果超出这个范围，应试者将甲音位读为乙音位，那么计为错误。根据波形图和语图，从后续元音来看，z h i 组正确音f 2 频率的可变范围为2 0 0 0 h z ， l o o h z ，z i 组正确音f 2 频率的可变范围为1 6 0 0 h z ，1 0 0 h z 。z h i 组缺陷音f 2 频率的可变范围为：+ l o o h z 至3 0 0 h z ，一l o o h z 至2 0 0 h z 。z i 组缺陷音f 2 频率的可变范围为：1 0 0 h z 至2 0 0 h z 。如果超过2 0 0 h z ，就进入到另一音位的数值范围，属于甲音位读为乙音位，那么计为错误。 z h 组与z 组后续元音的相互制约关系与正误评判情况如下表： f 2 ( h z ) 2 1 0 02 0 0 01 9 0 0 1 8 0 0 塞擦音塞音。尽管浊声母和元音用的都是嗓音声源，但是它们的语图( s p e c t r o g r a m ) 模式与元音不尽相同，浊音共振峰的强度较元音共振峰为小，且有些浊音共振峰与元音共振峰连接处会出现断层( 边音) 。在浊擦音里，同时有嗓音和噪音两种声源，表现在语图( s p e c t r o g r a m ) 上是同时有浊音共振峰和嗓音乱纹。第四段送气段此段只有送气塞音和送气塞擦音才有。在语图( s p e c t r o g r a m ) 上表现为类元音共振峰， 2 4 这些类元音共振峰大多是动态的。第五段过渡段过渡段指的是出于声母和韵母之间、跟韵母共振峰平滑衔接的一段高度动态性的浊音音段。从时间来看，也可以把这一段划分为韵母部分，因为这时声带已经开始振动，其共振峰与元音共振峰平滑衔接。过渡段的语图模式具有高度的动态性，这是由于辅音除阻后声腔的形状迅速向元音目标形状过渡所致。第六段起始目标值这一段相当于普通语音学中所说的介音。若把过渡段归入声母，则这一段就算是韵母的第一段，所以介音又叫“韵首”。并不是所有韵母都有这一段，只有当韵母里含有两个或三个音位，其中第一个音位又是 i 、 u 、 y 时刁有介音。介音在语图( s p e c t r o g r a m ) 上表现为很低的f l ，总能量较弱，且f l 、f 2 从开始就在向主要元音的核心目标值滑动。第七段核心目标值此段相当于普通语音学所说的主要元音。这一段是每一个韵母里不可缺少的，也是韵母的核心部分。普通话里所有的单元音都是主要元音。每个元音都有一个或几个典型目标值，也就是典型的共振峰模式。典型目标值并非经常可以达到，但是构成韵母的元音音位越少，主要元音就越接近目标值。若除了主要元音外还有介音和尾音，它们就会使主要元音偏离典型目标值。因此主要元音的共振峰模式并不总是恒定不变的，尤其在复韵母中，常常会看到主要元音的共振蜂( 主要是f l 和f 2 ) 发生上升或下降的变化。第八段收尾目标值或后音渡若韵母为三合元音时，这一段相当于普通语音学所说的元音性韵尾。元音性韵尾的声学表现跟介音和主要元音相似，只是其核心目标值更不容易达到。当韵母为鼻韵母时，这一段就承担着由主要元音向鼻尾过渡的任务。第九段鼻尾段鼻韵尾是普通话里唯一能出现在音节末尾的辅音。其声学特性与声母里鼻辅音基本相同。了解了普通话音节的声学语音学结构框架就掌握了分析普通话音节语图的流程。下面将分别对普通话声母的语音结构和韵母的语音结构做详细的介绍。 1 、普通话声母的语音结构。普通话里声母主要可分为6 大类：擦音、塞音、塞擦音、边音、鼻音、零声母。擦音共有六个：f 、h 、s 、s h 、x 、r 。擦音由音节结构框架里的第三段摩擦段和第五段过渡段构成。在语图( s p e c t r o g r a m ) 上，清擦音( f 、h 、s 、s h 、x ) 表现为持续时间较长的噪音乱纹。就清擦音总能量大小来看，f h s s h x ，就强频区频率高低来看， f h s h x s 。从语图( s p e c t r o g r a m ) 上看，清擦音向元音过渡时，其f 1 音渡都是从低到高。浊擦音r 语图( s p e c t r o g r a m ) 模式主要表现在：( 1 ) 具有类元音共振峰，还有迭加于其上的摩擦乱纹。( 2 ) 共振峰模式相对静止，然后平滑向元音过渡。

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（语言学及应用语言学专业论文）普通话水平测试评分系统的语图识别研究.pdf

文档简介

温馨提示

最新文档

评论

（语言学及应用语言学专业论文）普通话水平测试评分系统的语图识别研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档