面向智能机器人的Teager语音情感交互系统设计与实现 .pdf

上传人：h*** IP属地：江苏上传时间：2020-01-18 格式：PDF 页数：8 大小：506.76KB 积分：2.4 举报 版权申诉

已阅读5页，还剩3页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第 34 卷第 8 期 2013 年 8 月仪器仪表学报 C hi nese Jou rnal of Sc i enti fi c Instru m ent V o1 34 N o 8 A ug 20 13 面向智能机器人的 T eager 语音情感交互系统设计与实现木李翔李昕胡晨卢夏衍 1 上海大学机电l丁程与自动化学院上海200072 2 哈尔滨工业大学机器人技术与系统国家重点实验室哈尔滨150001 摘要自从 M aragos 首先提出了Teager 能量算子 TEO 后该算子得到了一系列应用 Teager能量算子的非线性特性使之能在抑制背景噪声的同时进行信号特征的有效提取它还保留了倒谱分析方法中的准稳态假设因而更能有效地表征语音信号的复杂性探索了基于 Teager能量算子的非线性特征对于区分情感语音的有效性并且进一步将其和普通的声学参数和音质参数相结合以应用于语音情感的识别中以 H M M 和 G M M 为分类器选取7 种情感设计了4 组对比实验达到最高 85 的识别正确率实验结果表明将传统的语音情感特征和Teager能量算子的非线性特征相结合能显著地提高语音情感识别系统的性能在此基础上提出了智能情感机器人进行情感交互的框架设计实现了智能服务机器人的情感交互系统经过实时情感交互实验验证该智能服务机器人可以很好地与交互对象进行简单的情感交流关键词 Teager能量算子非线性特征智能机器人语音情感交互系统中图分类号 TP391 42 文献标识码 A 国家标准学科分类代码 520 20 D e si gn an d i m p l em en ta ti o n o f sp eec h em o ti o n i n ter ac ti o n sy stem b ased o n T ea g er fo r i n tel l i g en t rob o t L i X i an g Li X i n H u C hen Lu X i ayan J Sc hool of M ec hatroni c E ngi neeri ng A utom ati on Shanghai Uni versi ty Shanghai 200072 Chi na 2 State Key Laboratory of Roboti c s and System H arbi n Insti tute of Tec hnol ogy H arbi n 150001 Chi na A bstrac t Si nc e M aragos fi rstl y put forward the Teager energy operator TE O the operator has got a seri es of appl i c ati ons T he nonl i near c harac teristi c s of th e T eager energy operator c an effec ti vel y extrac t si gn al feature w hi l e i nhi bi ti ng bac kground noi se at the sam e ti m e It al so retai ns the quasi steady state assu m pti on i n c epstrum anal ysi s m ethod and c an m ore effec ti vel y represen t th e c om pl exi ty of the speec h si gna1 T hi s paper di sc u sses the val i di ty of di sti n gui s hi ng em oti onal speec h based on the nonl i near features of T eager energy op erator and c om bi nes the n onl i near features w i th trad i ti on al ac ousti c par am eters and voi c e qual i ty param eters w hi c h are appl i ed to sp eec h em oti on rec ogni ti on T he H M M and G M M w ere used as the c l assi fi ers seven k i nds of em oti on status w ere sel ec ted to desi gn 4 group s of c om parati ve experim ents an d the hi ghest rec ogni ti on rate of 85 w as ac h i eved The experim ental resul ts i nd i c ate that c om bi ni n g the n onl i near c harac teristi c of th e T eager energy operator w i th tradi ti onal em oti onal speec h features c an i m prove the perform anc e of sp eec h em oti on rec ogni ti on system rem arkabl y O n thi s basi s thi s paper p uts forw ard the fram ew ork of i ntel l i gent em oti onal robot m aki ng em oti onal i nterac ti on desi gns and real i zes the i ntel l i gent servi c e robot em oti onal i nterac ti on system T hrough real ti m e em oti onal i nterac ti on experim ent veri fi c ati on th i s i ntel l i gent servi c e robot c an m ake si m pl e em oti onal c om m uni c ati on wi th i nterac ti ve objec ts K eyw ords T eager energy operator nonl i near feature i ntel l i gent robot em oti onal speec h i nterac ti on system 收稿日期 2013 01 Rec ei ved Date 2013 01 基金项目机器人技术与系统国家重点实验室开放基金项目 SKLS 2009 M S 10 资助学兔兔 w w w x u e t u t u c o m 第 8 期李翔等面向智能机器人的 Teager 语音情感交互系统设计与实现 1827 1 引言随着机器人技术日臻成熟智能服务机器人取得令人鼓舞的成就本田公司开发的 ASIM O 机器人可以行走自如并可以随着音乐翩翩起舞日本东京大学研制的 H RP 2 智能家庭服务机器人可以为人们端茶递水在工业及日常生活中机器人也被广泛地应用如照顾伤残人士及老弱病人随着智能服务机器人的发展人机交互 hum an robot i nterac ti on HR I 已经成为机器人科学和机电一体化领域的重要研究课题语音交流作为人机交互的主要方式之一不但能表达语义还能传递情感信息在消除人与机器人之间的障碍实现智能服务机器人的智能化研究过程中语音的情感识别变成关键技术这也成为智能服务机器人领域的研究课题之一智能服务机器人的人机交互系统有很大的应用潜力语音交互在其中发挥了巨大的作用例如家庭管家机器人佣人机器人 Sri kandi 移动机器人它们只需用语音命令操作就能实现控制以便对机器人或者计算机了解很少的人使用语音情感识别是人机交互和情感计算两大研究方向的重要领域之一大量研究显示语音包含了大量体现情感信息的特征参数包括基频能量共振峰频率频率倒谱系数 M el frequenc y c epstral c oeffi c i ent M FCC 等共几百个特征 M urray 等人总结了基频能量时长等韵律特征得出了语音音质特征与情感之间的定性关系使得韵律学特征成为语音情感识别的常用特征此后研究者加入共振峰参数来表征语音音质特征利用线性预测编码 1i near predi c ti ve c odi ng LPC M el M FCC 等语音学特征使得韵律学特征与语音学特征结合识别情感虽然世界各国的研究人员在语音情感研究的领域取得了许多研究成果但是如果将所有的这些成果放在一起比较可以发现大部分的研究人员都是采用韵律特征或者韵律特征的线性组合与变换作为研究对象不过还是有少数研究人员提出了一些新的特征参数作为研究对象比如 Guojun Zhou 等人就基于能量的基础上提出了基于 Teager能量算子 teager ener gY operator TEO 的特征在非线性领域的研究他们的实验证明音调是线性特征中最有效的而基于 TEO 的特征比音调更有效识别准确率比之音调提高了 5 马永林等人钊用基于 TEO 的基频对变异语音进行分类对特定人平均分类正确率达到了 93 3 多说话人分类正确率达到 85 8 Gao Hui 等人基于 TEO 的非线性特征采用隐马尔可夫模型 hi dden M arkov m odel H M M 在使用汉语语音的条件下识别悲伤和生气平静欢快 4 种情绪结果证实结合非线性 TEO 的识别特征 NFD M el A F M e l D A F M el 可有效提高情绪识别性能张德祥等人利用 Teager能量算子计算语音信号本征模态函数的瞬时能量并对本征模态函数进行系数峭度计算提取信号的统计特征信息用于语音信号的端点检测取得了良好的效果但是目前还没有基于 Teager 能量算子的非线性特征和普通的声学参数和音质参数相结合的专门研究因此还不足以说明 TEO 非线性特征对于情感识别的效果本文在 TEO 基频和基于时域 TEO 的 M el 倒谱系数的基础上加入了对于频域 TEO 的 M el 倒谱系数的研究并且将 TEO 的非线性特征和普通的情感特征相结合以探索在多特征向量下基于 TEO 的非线性特征对语音情感识别的有效性 2情感特征参数的选取 2 1传统的声学参数及音质参数情感特征的优劣直接影响到情感最终识别结果的好坏 Tato 从激发维 Arousa1 评价维 Val enc e 一强度维 Power 的三维空间情感模型指出如果提取出反映的情感维数越多的情感特征信息那么就越能更好地区分情感 Perei ra 等人的研究表明语音信号的韵律特征同3 个情感维度之间具有一定的相关性其中唤醒度和韵律特征之间的相关性明显 Gobl Johnstone Perei ra 等人的研究证明语音信号中的音质特征在能够很好地表达三维中的评价维信息的基础上还能够部分地反映三维空间情感模型中的强度维信息在证实了 Perei ra 的研究成果的基础上赵艳等人对共振峰等音质类特征进行进一步的研究发现共振峰等音质类特征与效价维的相关性较强因此根据 Cowi e 等人的研究结果为了更好地识别情感在提取基本的韵律特征参数的同时本文也考虑与语音的音质特征参数相结合提取短时能量 E 过零率 r 基频 F0 及其 1 2 阶差分 M FCC 及其 1 2 阶差分作为韵律参数第 1 第 2 第 3 共振峰 F1 F2 F3 作为音质参数将其结合用于 TEO 非线性特征的对比实验中 2 2 TE O 的非线性特征参数传统的线性声学理论认为来自声带的气流在声道内是以平面波的形式传播声音的产生主要取决于声道内的激励源位置和声带的振动而根据 Teager 2 的研究认为语音的生成是靠声门激励及声道中的涡流共同产生涡流广泛分布于整个声道内声道内交互作用的非线性涡流构成了真正的声源为度量这种非线性过程产生的语音 Teager提出了一个能量操作算子 TEO M aragos 等人认为该算子具有非线性能量跟踪信号特性不仅对学兔兔 w w w x u e t u t u c o m l 828 仪器仪表学报第 3 4 卷调幅 A M 信号的幅包络和调频 FM 信号的瞬时频率的变化非常敏感而且对不同类型的信号能清晰显示不同的 TEO 结果 Teager 和 Kai ser提出了非线性能量算子的连续形式引 f 1 式中是连续 Teager 的能量算子 TEO t 是一个连续语音信号 Kai ser 给出了其离散形式 n 是离散语音信号 n n 一 rt 1 n 一1 2 频域的离散 TEO 形式如下一x f 1 x f 一1 3 式中为频域的各个采样点 1 TEO 基频 NTD F0 基于 Teager能量算子的这种特点在进行情感语音分类时首先对原始语音信号进行 TEO 变换然后用自相关法提取基频从而得到特征参数 NTD FO 将非线性的 TEO 引入基频估计后可以从线性和非线性 2 个不同的研究角度研究基频的变化在基音检测时不再针对初始的语音信号而只是针对信号 TEO 后的非线性能量通过 TEO 研究声激励源的细微变化规律经 TEO 作用后的语音信号同原始语音信号具有相同的周期性而且有实验表明对于情感语音它具有更好的周期性 2 基于时域频域 TEO 的 M el 倒谱系数目前 TEO 主要是用于时域中 2 8 本文从时域和频域 2 个角度来提取 M el 倒谱系数得到 NTD M FCC non l i near ti m e dom ai n M F CC features 和 N FD M FC C nonl i n ear equenc y dom ai n M FCC features Teager能量算子能在抑制背景噪声的同时进行信号特征的提取它也保留了倒谱分析方法中的准稳态假设因而更能有效地表征语音信号的复杂性由情感语音特征分析结果可知与平静时的语音相比不同情绪下能量会在不同频段上偏移使得主要的能量在不同情绪下集中在不同的频段上愤怒和高兴均表现为能量的加强以及频谱中高频成分的增加与此相反悲伤对应于能量的减弱语速的减慢以及频谱中高频成分的降低害怕除了频谱中高频成分的增加外还包括基频曲线上抖动的加强和语速的加快这种能量分布的差异经过 TEO 变换后会更加明显而且有研究表明在语音信号的频域中语音信号的谱峰信息 peaks 要比谱谷 val l eys 信息语音感知方面拥有更大的贡献 j 因此基于频域的TEO 非线性变换可以强诃能量高时的谱峰信息使不同情绪间的语音能量有更加明显的差异在识别时系统能更明显地区分基于时域 TEO 的 M el 倒谱系数 NTD M FCC 的提取过程是首先对情感语音分帧预加重加汉明窗对每帧采样点用式 2 计算 TEO 然后计算 Ffvr 进而求得功率谱对谱值进行 M el 频域带通滤波滤波器个数为 24 对 M el 频域滤波器组的输出求自然对数和离散余弦变 D CT 从而得到 12 阶的 TEO 非线性 M FCC 特征参数 N T D M F C C 基于频域 TEO 的 M el 倒谱系数 NFD M FCC 的提取过程为首先对情感语音分帧预加重加汉明窗计算 F丌对各点谱值用式 3 计算 TEO 对经 TEO 变换后的谱值进行 M el 频域带通滤波滤波器个数为 24 对 M el 频域滤波器组的输出求自然对数和离散余弦变换 D CT 从而得到特征 NFD M FCC 两种参数的提取过程分别如图 1 所示图 1特征提取结构图 F i g 1 F eature extrac ti on struc ture di agram 3 实验与结果本实验的情感语句来自德国柏林情感语音库选取 A n ger B ored om D i sgust F ear H ap p i n ess N eu tral S ad ne ss 7 种情感每种情感 70 句共 490 条语句组成本文的实验数据库其中有 5 男 5 女 10 位话者每种情感随机选取 50 句共 350 句组成训练样本集剩下的每种情感 20 句共 140 句组成测试样本集本实验是基于连续隐马尔科夫模型的语音情感识别系统选取每个 H M M 模型具有 5 个状态高斯混合数为 5 为避免分类器训练不确定性对检验结果的干扰进一步做了在 G M M 分类器下的对比实验对情感识别的结果进行检验和比较对于每种情感建立一个 GM M 模型进行训练在识别阶段计算测试样本的特征向量在每种情感 GM M 模型下的似然得分将似然得分最大的 G M M 模型作为识别结果输出另外本文在对实验结果进行统计分析其识别正确率的同时也计算单一情感的误识率单一情感误识率代表某种情感的被误识率定义如下他种情感误识别为此类情感的样本数除以总的测试样本数单一情感误识率可以更好地反映出哪种情感最容易为其他情感所混淆本文设计的 4 组对比实验如下 1 选取普通基频 F1D 和 TEO 基频 NTD F0 作为第 1 组检验 TEO 基频对于情感分类的效果 2 次实验学兔兔 w w w x u e t u t u c o m 第 8 期李翔等面向智能机器人的Teager语音情感交互系统设计与实现 1829 特征参数如下 FD 及其 1 2 阶差分共 3 维 NTD F0 及其 1 2 阶差分共 3 维 2 选取普通 M FCC 和基于时域频域 TEO 的 M el 倒谱系数作为第 2 组检验基于 TEO 非线性的 M FCC 情感分类效果 3 次实验的特征参数如下 M FCC 及其 1 2 阶差分共 36 维 NTD M FCC 及其 1 2 阶差分共 36 维 NFD M FCC 及其 1 2 阶差分共 36 维 3 将基频和 M FCC 相结合作为第 3 组对比实验对比 TEO 基频和 TEO 的 M FCC 与普通的基频和 M FCC 对于情感分类的效果 3 次实验的特征参数如下 FD 及其 1 2 阶差分 M FCC 及其 1 2 阶差分共 39 维 NTD F0 及其 1 2 阶差分 NTD M FCC 及其 1 2 阶差分共 39 维 NTD F0 及其 1 2 阶差分 NFD M FCC 及其 1 2 阶差分共 39 维 4 最后将 TEO 的非线性特征和能量过零率第 1 第 2 第 3 共振峰参数组成声学参数和音质参数相结合的多特征向量情感识别特征参数作为第 4 组对比实验来检验在多特征向量下 TEO 非线性特征的情感分类性能 3 次实验的特征参数如下及其 1 2 阶差分 M FCC 及其 1 2 阶差分 E r F1 F2 F3 共 44 维 NTD F0 及其 1 2 阶差分 NTD M FCC 及其 1 2 阶差分 E r F1 F2 F3 共 44 维 NTD F0 及其 1 2 阶差分 NFD M FCC 及其 1 2 阶差分 E r F1 F2 F3 共 44 维分别在 H M M 模型和 G M M 模型下完成上述实验记录结果如下 1 H M M 作为分类器如表 1 4 所示 TEO 基频相比普通基频识别率有所提高但由于特征维数较低二者识别率都不高故不作详细分析表 1 基频特征 3 维 T abl e 1 F undam ental frequenc y c harac te sti c s 3 D 特征总识别正确率 F10 N T D F 0 3 3 57 36 43 表 2 M FC C 特征 36 维 Tabl e 2 M FCC c harac teri sti c s 36 D 表 3 基频及 M F C C 特征 39 维 Tabl e 3 Fundam ental frequenc y and M FCC c harac teri sti c s 39 D 学兔兔 w w w x u e t u t u c o m 1830 仪器仪表学报第 3 4 卷表 4 韵律特征及音质特征结合 44 维 Tabl e 4 C om bi nati on of prosodi c features and voi c e qual i ty features 44 D 2 GM M 作为分类器如表 5 8 所示由于使用 GM M 分类器效果不如 H M M 而且 G M M 是验证 TEO 的非线性在不同分类器下是否有效故不列出详细结果表 5 基频特征 3 维 T abl e 5 Fundam ental frequenc y c harac teri sti c s 3 D 特征总识别正确率 F 0 34 2 9 N T D F 0 36 4 3 表 6 M FC C 特征 36 维 T abl e 6 M F C C c harac teri sti c s 36 D 特征总识别正确率 M F C C N T D M F C C N F D M F C C 6 2 86 6 O 00 6 5 7 1 表 7 基频及 M F C C 特征 39 维 T ab l e 7 F u nd a m enta l freq ue nc y an d M F C C c harac teri sti cs 39 D 特征总识别正确率 F1D M F C C N T D F O N T D M F C C N T D F O N F D M F C C 6 6 4 3 5 8 5 7 7 0 0 o 表 8 韵律特征及音质特征结合 44 维 T ab l e 8 C om b i na ti on o f p rosodi c featu res and voi c e qual i ty features 44 D 特征总识别正确率 FD M FC C 及 E r F 1 F2 F3 N T D F O N T D M FC C 及 E r F 1 172 F3 N T D F 0 N F D M F C C 及 E r F 1 F2 F3 70 OO 66 43 72 86 1 整体上 H M M 的分类效果较 GM M 要好当特征维数较低时 3 维 H M M 和 GM M 分类器的识别效果相差不大当特征维数增大时 30 维以上识别效果相差较大达到 10 以上这是因为 H M M 模型不仅用混合概率密度函数来逼近特征矢量的分布情况同时 H M M 模型还建立了若干状态基于 M arkov 链的随机过程还可以很好地跟随特征矢量的动态变化 2 与传统的语音情感特征相比带有 NTD M FCC 参数的实验在不同的分类器及不同的特征组合下对识别效果均有一定程度的下降说明基于时域 TEO 的 M el 倒谱系数不是一个有效的特征而带有 NFD M FCC 参数的实验在不同的分类器及不同的特征组合下对识别效果均有一定程度的提升这说明基于频域 TEO 变换的 M el 倒谱系数特征在情感识别中是有效的故此以下对带有 NFD M FCC 参数的特征组合进行详细的分析从整体识别正确率出发以 H M M 为例 4 组对比实验中平均识别正确率分别提高了2 86 2 14 3 57 和 5 72 以 GM M 为例 4 组对比实验中识别正确率分别提高了 2 14 2 85 3 57 和 2 86 从特征维数的角度出发在 H M M 分类器中随着特征维数的增大识别正确率随之上升频域 TEO 的非线性特征对正确率的提升率也随之增大尤其是当特征维数较大时 4O 维以上频域 TEO 的非线性特征可以显示出更好的情感区分效果在 GM M 分类器中随着特征维数的增大识别正确率随之上升但是频域 TEO 的非线性特征对正确率的提升率并不是一直上升的当特征维数在 40 维以上时正确率的提升率下降这是因为当特征维数较大时 GM M 的分类效果相比 HM M 要差 3 从单一情感误识率的角度出发可以看出识别正确率较低的情感其误识率也相对较低在不同的分类器和特征组合下一般 Anger 只误识为 H appi ness 反之亦然因此 Anger和 H appi ness 相对于其他 5 种情感较为独立可以比较容易地先将这 2 类情感从 7 种情感中区分出来另外 Boredom 和 Neutral 也较难区分容易混淆 4 从单一情感的识别效果出发取不同分类器下第 2 3 4 组对比实验中普通情感特征和频域的 TEO 特征的结果共 l 2 组数据计算每种情感在普通特征下和频域学兔兔 w w w x u e t u t u c o m 第 8 期李翔等面向智能机器人的 Teager 语音情感交互系统设计与实现 1831 TEO 非线性特征下的平均识别率并计算其差值作为识别率比较的依据最后计算各种情感的最大最小识别正确率及其差值平均识别正确率和平均被误识率如表 9 所示表 9各种情感的最大最小识别正确率及其差值平均识别正确率和平均被误识率 T a b l e 9 T h e m axi m u m m i ni m u m c o rre c t rec og n i ti o n rates and th ei r d i ff eren c es av era ge c orrec t rec ogn i ti on rates and average m i srec ogni ti on rates for vari ous em oti ons 从表中可以看出频域 TEO 非线性特征对于情感 Anger Di sgust Neutral Sadness 的识别正确率均有一定的提升效果尤其是 Di sgu st 和 Sadness 分别提升了 6 67 和 13 33 而对于 Boredom 的识别正确率虽有下降但是下降率不大与Anger 的提升率持平对于隋感 Fear和Happi ness则没有影响此外除了 Boredom 外最大识别正确率均出现在带有 NFD M FCC 参数的非线性特征组合中需要注意的是在以 HM M 为分类器带有 NFD MFCC 参数的各类特征相结合的实验中对 Sadness 的识别正确率达到了 100 进一步说明了 TEO 非线性特征的有效性不管是在最小最大还是平均识别正确率中 Di sgu st和 Sadness 的识别效果最好 H appi ness 的识别效果最差从最大最小正确率的差值中可以看出 Fear 和 di sgu st 的波动相对较小说明在不同的分类器及特征组合情况下对于 Fe ar 和 di sgu st 的识别效果相对稳定而 Boredom Neutral 和 Sadn ess 波动相对较大证明此 3 类隋感受分类器及特征组合的情况影响较大另外 Fe ar 的平均单一情感误识率最高这是因为 Fe ar 情感的表达比较灵活依个人表达习惯不同而没有明显的基频频谱能量分布等特征因此很容易与其他情感混淆孙颍等人针对 4 种不同特征 LPCC TEO M FCC ZCPA 在德国柏林语音库的实验平均识别率为81 75 单独使用 l EO 特征的识别率为 80 83 3 采用本文所提出的基于频域 TEO 变换的 M el 倒谱系数特征识别率达到 85 这证明这一特征的有效性和可靠性 4 智能机器人语音情感交互系统设计与实现 1 实时语音情感交互实验本实验的实验平台为上海市电站自动化重点实验室智能服务机器人 SKLPAT 实验过程为实验者对着机器人 SKLPAT 说含有情感的语音然后 SKLPAT 将反馈情感用语音表达出来本实验分别选取基于 TEO 的 M el 倒谱系数 TFCC 基频 PF Pi tc h frequenc y 和 M FCC 相结合 PF M FCC M FCC 等 3 种特征参数来训练语音模型实验针对高兴悲伤愤怒平静 4 种情感进行识别每种情感由实验者现场说 20 句话每种特征参数的实验总共 80 句实验结果如表 10 所示表 1O实时情感交互实验结果 T ab l e 1 0 R eal ti m e em o ti on i ntera c ti on experi m ents resul t 由表 l 0 可以看出智能服务机器人 SKLPAT 的语音情感实时识别实验的平均识别率可以达到 73 75 可以进行情感交互用来满足一些特定的交互场景但是识别率还不是很高主要是由以下几个方面造成的 1 人的情感是通过面部表情行为语音生理反应等多种方式综合体现的一种心理活动语音信号只是情感表达的一种形式 2 所应用的情感语音库并也不是真正意义上的语音数据库如何评测实验用的情感数据的真实有效性国内外暂时还没有统一的标准实验人员在语音录制环境及方法上有待于进一步提高 3 语音信号的情感特征和特定文本信息是密切相关的本实验中设计的通用的实验语句会削弱语音中的情感特征 4 实验中训练的样本总数是有限的不能对语音情感模型做出完全准确的训练学兔兔 w w w x u e t u t u c o m 1832 仪器仪表学报第 3 4 卷 5 结论本文从基于 Teager能量算子的非线性特征人手将其用于反映激发维信息的韵律特征参数的改进中并与能够反映评价维和强度维信息的音质特征参数相结合利用 H M M 模型对 7 种情感分类取得了平均最高 85 的正确率说明基于 Teager能量算子的非线性特征确实是一种较有效的情感特征参数无论是将其单独作为分类特征还是与反映其他信息的特征参数相结合均比传统的特征参数表现出了更佳的分类性能基于 TEO 的非线性特征在带有情感环境下的语音分析体现了一定的动态语音生成时的非线性变化今后还需要在该领域有更多的深入研究和完善参考文献 1 CHIAVERINI S SICILIANO B VILLANI L A survey of robot i nterac ti on c ontrol sc hem es w i th experim ental eom pari son J IEEE A SM E Trans M ec hatroni c s 1999 4 3 273 285 2 GA SSERT R M OSER R BU R D ET E et a1 M RI fM R I c om p ati b l e roboti c system w i th forc e feedb ac k for i nterac ti on wi th hum an m oti on J IEEE A SM E Trans M ec ha tro ni c s 2006 11 2 216 224 3 K UL II B JA N O S S TIBO R S M obi l e robot c ontrol l ed by voi c e C Intern ati onal Sym posi um on Intel l i gent System s an d Inform ati c s 200 7 89 192 4 LIU P x CH A N A D C CH E N R et a1 Voi c e based ro bot c ontrol c Internati onal Conferenc e on Informati on A c qu i si ti on 2 005 54 3 54 7 5 JEA N J H H SIEH M J LIN Z Devel opm ent of a house keepi ng robot wi th vi sual servoi ng c apabi l i ti es c Ic C A S S IC E 200 9 7 12 7 16 1 6 l B UD IH A R TO W JA ZID IE A PU RW A N TO D Indoor n avi gati on usi ng ad ap ti ve neuro fu zzy c ontrol l er fo r serv ant ro bot C Internati onal Conf erenc e on Com puter En gi neeri ng and A ppl i c ati ons ICCE A 2010 582 586 7 THIAN G D W Li m i ted speec h recogni ti on for c ontroll i ng m ovem ent of m ob i l e robot i m pl em ented on A T m ega l 62 m i c roc ontrol l er C Intern ati onal Conferenc e on Com puter an d A utom ati on Engi neeri ng ICCAE 20O9 347 350 8 高美娟杨智鑫田景文移动机器人实时语音控制的实现 J 电子测量技术 2011 34 7 50 53 G A P M J Y A N G Z H X TIA N J W A c hi eve c ontrol by real ti m e voi c e of the m obi l e robot J El ec troni c M eas urem ent Tec hnol ogy 20 11 34 7 50 53 9 W EIGA N D E Em oti ons The si m pl e an d the c om pl ex M 10 12 13 14 15 16 17 18 19 A msterdam Phi l adel phi a John Benjam i ns Publ i shi ng C om pany 20O4 M U R R A Y I R A R N O T r J L T ow ard the si m td ati on of em oti on i n syntheti c sp eec h a revi ew of th e l i teratu re on hum an voc al em oti on J1 Journal of the Ac ousti c al Soc i ety of Am eri c a 1993 93 2 1097 1108 G U Y 0 N I G U N N S N IK R A V ES H M et a1 Feature extrac ti on foundati ons an d appl i c ati ons M Spri nger 2006 罗宪华杨大利徐明星面向非特定人的语音情感识别特征研究 J 北京信息科技大学学报 2011 26 2 72 76 L U O X H Y A N G D L X U M X Sp eec h em oti on rec ogn i ti on fo r non spec i fi c hum an c har ac teri sti c s J Journal of Bei ji ng Inf orm ati on Sc i enc e Tec hnol ogy U ni versi ty 2011 26 2 72 76 黄程韦赵艳实用语音情感的特征分析与识别的研究 J 电子与信息学报 2011 33 1 112 116 H U A N G C H W Z H A O Y P rac ti c al sp eec h em oti on an al ysi s and rec ogni ti on J Journal of el ec troni c s Info rm a ti on Tec hnol ogy 2011 33 1 112 116 姜晓庆崔世耀殷艳华人机语音交互中的情感语音处理 J 济南大学学报 2008 22 4 354 357 JIA NG X Q CU I SH Y YIN Y H em oti onal voi c e pro c essi ng i n the hum an m ac hi ne voi c e i nterac ti onf J Jour nal of U ni versi ty of Ji nan 2008 22 4 354 357 Z H O U G H A N SE N J H L K A ISE R J F C l assi fi c ati on of speec h un der stress based on features deri ved from th e nonl i near teager energy operator J ICA SSP 98 1998 54 9 55 2 马永林韩纪庆张磊等基于 Teager 能量算子 TE O 基频的应力影响下的变异语音分类 J 声学学报 2002 27 6 519 522 M A Y L H A N J Q ZH A N G L et a1 Based on teager en ergy operator TEO baseband stress under the i nfl uenc e of vari ati on of voi c e c l assi fi c ati on J Chi nese Journal of A c ousti c s 2002 27 6 519 522 G A P H C H E N S E m oti on c l assi fi c ati on of m an d ari n speec h based on T EO nonl i near features f J Softwar e E ngi n eering A rti fi c i al In tel l i genc e N etw orki n g and P ar al l el D i stributed C om puti n g 2 007 3 3 94 3 98 张德祥吴小培吕钊等基于经验模态分解和 Teager 峭度的语音端点检测 J 仪器仪表学报 2010 31 3 493 499 Z H A N G D X W U X P L V Z H et a1 B ased on em pi ri c al m od e dec om p osi ti on an d T eager kurtosi s sp eec h en dpoi n t detec ti on J Chi nese Journ al of Sc i enti fi c Instrum ent 2010 31 3 493 499 PEREIRA C Di mensi ons of emoti on meani ng i n speec h C 学兔兔 w w w x u e t u t u c o m 第 8 期李翔等面向智能机器人的Teager语音情感交互系统设计与实现 1833 20 21 22 23 24 25 26 27 28 Proc ISC A W ork shop on Speec h and E m oti on A C onc eptual Fram e W ork for R esearc h Beff ast 2000 25 28 张石清赵知劲雷必成等结合音质特征和韵律特征的语音情感识别 J 电路与系统学报 2009 14 4 120 123 ZH A NG SH Q ZH A O zH J LE I B CH et a1 Com bi na ti on of q ual i ty featu res an d prosod i c featu res of speec h em oti on rec ogni ti on J Journal of C i rc ui ts and System s 2009 14 4 120 123 赵艳赵力邹采荣结合韵律和音质参数的改进二次判别式在语音情感识别中的应用 J 信号处理 2009 25 6 882

人人文库> 全部分类> 专业文献 > 学术论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

面向智能机器人的Teager语音情感交互系统设计与实现 .pdf

文档简介

温馨提示

最新文档

评论

面向智能机器人的Teager语音情感交互系统设计与实现 .pdf

文档简介

温馨提示

最新文档

评论

相关文档