基于单片机的录音与播放系统开发设计毕业论文.doc_第1页
基于单片机的录音与播放系统开发设计毕业论文.doc_第2页
基于单片机的录音与播放系统开发设计毕业论文.doc_第3页
基于单片机的录音与播放系统开发设计毕业论文.doc_第4页
基于单片机的录音与播放系统开发设计毕业论文.doc_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题 目:基于单片机的数码录音与播放系统开发设计学 院:信息电子技术学院年 级:专 业: 自动化姓 名: 学 号: 指导教师: 摘 要毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日摘 要本次课程设计的主要目的是制作一个基于单片机的数码录音和播放系统。选用凌阳16位单片机SPCE061A和外部扩展存储器W29C040来实现。其具有体积小、集成度高、易扩展、可靠性高、功耗低、结构简单、中断处理能力强等特点,特别适应于数字语音录放和语音识别等数字应用领域。 SPCE061A是台湾凌阳公司生产的十六位单片机,该单片机内置有2路DA转换,8路AD转换及在线仿真等丰富的功能, W29C040是台湾华邦公司生产的4M位的FLASH存储芯片,利用它存储凌阳格式的语音资源。该系统可以广泛应用于需求的录音较长的场合。如检测温度的存储播放系统,自录语音提示等应用方案。本系统提供W29C040相关的读写模块,此模块也可应用于W29C040同系列的相关FLASH芯片中。如果是简单的控制对象,只需要利用单片机作为控制核心,不需要另加外部设备就能实现。对于较复杂的系统,只需对单片机进行适当的扩展即可,十分方便。对一个复杂或功能强大的语音, 图象处理系统需要很大的,不同的存储器(ROM,FLASH,SRAM)的存储空间,为了解决I/O不够的问题,我们使用W29C040芯片来扩展SPCE061A的存储器来实现更大空间的存储。关键字:SPCE061A;闪存;W29C040;语音输入/录放佳木斯大学教务处 - iv -AbstractAbstractThis curriculum designs mainly is 16 monolithic integrated circuits which newly develops using Ling Yangzui manufactures based on SPCE061A and the W29C040 digital sound recording and the broadcast system. This system provides the W29C040 correlation the read-write module, this module also may apply to W29C040 with the serise in correlation FLASH chip. SPCE061A is Taiwan insults 16 monolithic integrated circuits which the positive company produces, in sets has 2 group DA to transform _ group AD transformation and the on-line simulation and so on rich function W29C040 M FLASH memory chip, uses it to save insults the positive form the pronunciation resources,. This system may widely apply to a demand recording longer situation. If the temperature examination memory broadcast system, from records application plan and so on voice prompt.Keywords :PCE061A ;W29C040;flash memory;voice record目 录目 录摘 要iAbstractii第 1 章 绪论1第 2 章 总体设计3第 3 章 硬件系统的设计与实现43.1 方案的选择43.1.1 80C51方案43.1.2 DSP方案43.1.3 凌阳方案43.2 凌阳单片机的简介53.2.1 综述53.2.2 结构概览83.2.3 芯片的引脚排列和说明83.2.4 SPCE061A最小系统103.2.5 SPCE061A开发方法113.3 SPCE061A 的外部存储器(Memory)的扩展123.3.1 综述123.3.2 W29C040的介绍133.3.3 W29C040写、擦除流程图143.3.4 SPCE061A与W29C040的硬件连接图16第 4 章 软件系统的设计与实现194.1 凌阳音频介绍194.1.1 音频概述194.1.2 数字音频的采样和量化194.1.3 音频格式的介绍194.1.4 语音压缩编码基础194.2 凌阳音频编码算法214.2.1 压缩分类214.2.2 凌阳常用的音频形式和压缩算法214.2.3 凌阳语音的播放、录制、合成和辨识224.2.4 语音录入使用介绍234.3 W29C040与SPCE061A的系统软件设计274.3.1 本系统软件实际流程图274.3.2 程序源代码:30第 5 章 拓 展 设 计315.1 数码录音和播放系统的增强设计315.2 温度测量显示存储系统325.2.1 系统总体方案介绍325.3 SPCE061A的周边模块325.3.1 电源模块325.4 系统的软件设计325.4.1 主流程325.5 凌阳的其他应用33结 论36致 谢37参考文献38附录A39附录B41附录C44附录D54佳木斯大学教务处 - 2 -毕业论文(设计)用纸第 1 章 绪论随着电子技术的快速发展,语音处理技术越来越多在工业、交通、通信等领域得到应用。语音处理的理论和技术也日趋完善和成熟。人们对语音技术的实际需求也越来也迫切,使得语音处理实用化产品不断出现。语音录音播放设备在人们的生活娱乐中一直以不同种类为人们提供各种各样的服务。例如,复读机的出现为学习外语提供了便利,它不仅仅是一种学习工具,更是一种科学的学习方法;录音播放电话机,用来记录通话双方的谈话内容以备参考,并在主人外出时,可在录音播放中留言并收录呼叫方的留言以便事后处理,大大的减少了一些不必要的麻烦。从老式的晶体管录音机到今天的微型录放机不断发展的过程,说明在人们的生活娱乐中语音录音播放设备占有越来越重要的地位,通过录音播放享受生活已经成为人们不可缺少的生活方式。如今,随着消费类电子的兴起和繁荣以及各类芯片的发展,人们对录音播放设备的需求也不断的增多,录音播放设备应用的领域也不断增加。从以往在生活中的应用渐渐发展到语音识别、语音控制方面的应用。传统的录放解决方案存在电路体积大、录放效果差、稳定性欠佳等弊端逐渐展现出来。语音录音播放系统也在不断的改进传统的录放所存在弊端。并向着体积小、录放效果好、稳定性强、系统更完善的方向发展。本次的录音播放控制器设计正是符合了录音播放设备的这种发展大环境,满足了人们的需要。随着计算机技术的发展和在控制系统中的广泛应用,以及设备向小型化、智能化的发展,作为高新技术之一的单片机以其体积小,功能强,价格低,使用灵活等特点,显示出出很强的生命力。可以认为,单片机技术已经成为现代电子技术的十分重要的技术之一,可以使设计的电子产品更具智能化和先进性。进入21世纪以来,开发推出单片机的公司很多,各种高性能单片机芯片市场也异常活跃,新技术的不断采用,更加使单片机的种类、性能以及应用领域不断扩大和提高。台湾凌阳科技公司公司最近推出一种新型16位单片机SPCE061A。该单片机的问世,使得16位单片机的科技含量及应用跃上一个新的台阶。在航空航天,机械加工,智能仪器仪表,家用电器,通信系统,智能玩具等领域,单片机都发挥了巨大的作用。单片机是随着微型计算机,单板机的发展及其在智能测控系统中的应用而发展起来的。随着微电子技术的迅速发展,目前世界上各个公司都研制出了各种应用领域的单片机,单片机芯片市场也异常活跃,从8位低端,到高性能的16位,到集成度,速率,可靠性等全方位向更高水平发展的32位系列。随着微电子,半导体工艺的不断进步,单片机芯片在向高度集成化,低功耗的方向发的发展。目前世界上各个公司都研制出了各种应用领域的单片机,如ATMEL公司的80C9X系列,INTEL公司的MCS-5X系列,MOTOROLA的68系列和ZILOG的Z8系列。目前,中国台湾的凌阳公司最新推出了16位的SPCE系列由于其在语音功能的独特应用,得到了广大客户的认可,因此,也是我这次毕业论文所选择的单片机。本次毕业论文就是选用凌阳16位单片机SPCE061A和外部扩展存储器W29C040来实现数码语音的录取和播放系统。第 2 章 总体设计本系统是由单片机、按键、音频输入、音频输出和外部扩展存储器等五个主要部分通过硬件电路的连接组合在一起而组成,并通过一系列的操作来完成对语音芯片的录音/播放功能。系统的主要器件结构框图如图2-1所示。输出储存单片机按键MIC输入图2-1 系统的主要器件结构图本系统包括按键部分、音频录入部分、音频输出部分和W29C040存储扩展等四部分。按键部分:按键1 开始语音录入按键2 停止录音,播放语音。音频录入部分:主要是由MIC、自动增益电路、AD转换电路构成,通过MIC采样语音数据,并经内置自动增益电路处理、AD转换后,编码并存储。音频输出部分:主要是将音频输出端放大,经喇叭播放。存储扩展部分:通过控制,将录音编码后的数据存储。系统实现的功能:通过按键1,开始录音,按键2,结束录音并播放所录的语音。播放结束后,可以继续录入下一段语音。第 3 章 硬件系统的设计与实现3.1 方案的选择当今微型计算机技术的发展形成两大技术分支:一是以微处理器MPU为核心组成的通用微机系统;另一分支是发展面向对象的用于实时测控的微控制器MCU即单片机。随着超大规模高速集成电路的发展,现代电子技术进入了片上系统SOC(System On a Chip)阶段,从而使单片机的设计与应用发生了深刻的变化。凌阳科技推出的nSP单片机就是基于SOC的新型数/模混合的系统芯片。凌阳单片机顺应了单片机技术的发展趋势,其系统芯片具有集成度高,数/模混合,功能全,低功耗,低电压和易于开发等特点。另外,凌阳单片机还增加了适合与DSP的某些特殊指令;有的还嵌入了LCD控制/驱动和双音多频发生器功能。这些都进一步扩大了单片机的应用范围。凌阳公司为nSP单片机的应用开发提供了较为完善的开发支持工具。nSP CPU系统仿真板,高性能的C语言编译器,并提供了C语言的编程函数库。因此,我们本次毕业设计选择nSP单片机来做一个复读机,在做的过程中熟悉一下凌阳单片机。凌阳单片机自带的存储器是不够的,所以我们必须扩展外部存储器。3.1.1 80C51方案在我国单片机的市场中,51单片机曾经占据着绝对的主导地位,但在科技不断发展的当今,嵌入式系统正在不断流行开来,对单片机的处理速度的要求不断提高,对单片机的处理功能也要求越来越强。我个人认为,除了其速度不够快外,集成度不高是51最大的缺点。在当今比较高端应用场合,可能再也难以见到51单片机的身影,取而代之的是ARM和DSP等处理器。3.1.2 DSP方案在数字信号处理方面,处处可以见到DSP的身影。对于本系统中的语音采集,数据处理存放,语音回放,DSP可以轻而易举的完成这些基本功能。DSP强大的数据处理能力是让众多的单片机都望尘莫及的。3.1.3 凌阳方案我认为,凌阳是51和DSP之间的一种良好的结合。SPCE061A是台湾凌阳公司生产的十六位单片机,该单片机内置有2路DA转换,8路AD转换及在线仿真等丰富的功能,这些都为我们实现数码录音和播放提供良好的方便条件, W29C040是台湾华邦公司生产的4M位的FLASH存储芯片,利用它存储凌阳格式的语音资源。该系统可以广泛应用于需求的录音较长的场合。如录音笔、自录语音提示等应用方案。本系统提供W29C040相关的读写模块,此模块也可应用于W29C040同系列的相关FLASH芯片中另外,凌阳十六位单片机具有易学易用的效率较高的一套指令系统和集成开发环境。在此环境中,支持标准C语言,可以实现C语言与凌阳汇编语言的互相调用,并且,提供了语音录放的库函数,只要了解库函数的使用,就会很容易完成语音录放 综上所述,我们选择了凌阳方案。 3.2 凌阳单片机的简介3.2.1 综述随着单片机功能集成化的发展,其应用领域也逐渐地由传统的控制,扩展为控制处理、数据处理以及数字信号处理(DSP,Digital Signal Processing)等领域。凌阳的16位单片机就是为适应这种发展而设计的。它的CPU内核采用凌阳最新推出的nSP(Microcontroller and Signal Processor)16位微处理器芯片(以下简称nSP)。围绕nSP所形成的16位nSP系列单片机(以下简称nSP家族)采用的是模块式集成结构,它以nSP内核为中心集成不同规模的ROM、RAM和功能丰富的各种外设接口部件。nSP内核是一个通用的核结构。除此之外的其它功能模块均为可选结构,亦即这种结构可大可小或可有可无。借助这种通用结构附加可选结构的积木式的构成,便可形成各种不同系列派生产品,以适合不同的应用场合。这样做无疑会使每一种派生产品具有更强的功能和更低的成本。 nSP家族有以下特点: 体积小、集成度高、可靠性好且易于扩展 nSP家族把各功能部件模块化地集成在一个芯片里,内部采用总线结构,因而减少了各功能部件之间的连线,提高了其可靠性和抗干扰能力。另外,模块化的结构易于系统扩展,以适应不同用户的需求。 具有较强的中断处理能力 nSP家族的中断系统支持10个中断向量及10余个中断源,适合实时应用领域。 高性能价格比 nSP家族片内带有高寻址能力的ROM、静态RAM和多功能的I/O口。另外,nSP的指令系统提供具有较高运算速度的16位16位的乘法运算指令和内积运算指令,为其应用增添了DSP功能,使得nSP家族运用在复杂的数字信号处理方面既很便利,又比专用的DSP芯片廉价。 功能强、效率高的指令系统 nSP指令系统的指令格式紧凑,执行迅速,并且其指令结构提供了对高级语言的支持,这可以大大缩短产品的开发时间。 低功耗、低电压 nSP家族采用CMOS制造工艺,同时增加了软件激发的弱振方式、空闲方式和掉电方式,极大地降低了其功耗。另外,nSP家族的工作电压范围大,能在低电压供电时正常工作,且能用电池供电。这对于其在野外作业等领域中的应用具有特殊的意义。 SPCE061A 是继nSP系列产品SPCE500A等之后凌阳科技推出的又一款16位结构的微控制器。与SPCE500A不同的是,在存储器资源方面考虑到用户的较少资源的需求以及便于程序调试等功能,SPCE061A里只内嵌32K字的闪存(FLASH)。较高的处理速度使nSP能够非常容易地、快速地处理复杂的数字信号。因此,与SPCE500A相比,以nSP为核心的SPCE061A微控制器是适用于数字语音识别应用领域产品的一种最经济的选择。性能16位nSP微处理器;工作电压(CPU)VDD为2.43.6V(I/O)VDDH为2.45.5VCPU时钟:0.32MHz49.152MHz;内置2K字SRAM;内置32KFLASH;可编程音频处理;晶体振荡器;系统处于备用状态下(时钟处于停止状态),耗电仅为2A3.6V;2个16位可编程定时器/计数器(可自动预置初始计数值);2个10位DAC(数-模转换)输出通道;32位通用可编程输入/输出端口;14个中断源可来自定时器A/B,时基,2个外部时钟源输入,键唤醒;具备触键唤醒的功能;使用凌阳音频编码SACM_S240方式(2.4K位/秒),能容纳210秒的语音数据;锁相环PLL振荡器提供系统时钟信号;32768Hz实时时钟;7通道10位电压模-数转换器(ADC)和单通道声音模-数转换器;声音模-数转换器输入通道内置麦克风放大器和自动增益控制(AGC)功能;具备串行设备接口;具有低电压复位(LVR)功能和低电压监测(LVD)功能;内置在线仿真电路ICE(In-CircuitEmulator)接口;具有保密能力;具有WatchDog功能应用领域家用电器控制器:冰箱、空调、洗衣机等白色家电仪器仪表:数字仪表(有语音提示功能)电表、水表、煤气表、暖气表工业控制智能家居控制器通讯产品:1、多功能录音电话2、自动总机3、语音信箱4、数字录音系统产品5、医疗设备6、保健器械(电子血压计、红外体温监测仪等)7、体育健身产品(跑步机等)8、电子书籍(儿童电子故事书类)9、电教设备等语音识别类产品(语音识别遥控器、智能语音交互式玩具等)3.2.2 结构概览SPCE061A的结构如图3-2所示图3-2 SPCE061A结构图3.2.3 芯片的引脚排列和说明SPCE061A封装片为84个引脚,它的排列如图3-3所示:图3-3 SPCE061A封装排列图管脚描述见表3-1表3-1 管脚描述表管脚名称管脚编号类型描述IOA15,846-39输入输出IOA15,8双向IO端口IOA7,034-27输入输出IOA7,0:通过编程,可设置成唤醒管脚IO6,0:与ADC Line In输入共用IOB15,1150-54输入输出IOB15,11,双向IO端口,IOB10,0除用作普通的IO端口,还可作为:IOB107输入输出IOB10:通过异步串行数据发送管脚TxIOB958输入输出IOB9:TimerB脉宽调制输出管脚BPWMOIOB859输入输出IOB8:TimerA脉宽调制输出管脚APWMOIOB760输入输出IOB7:通用异步串行数据接收管脚RxIOB661输入输出IOB6:双向IO端口IOB562输入输出IOB5:外部中断元EXT2的反馈管脚IOB463输入输出IOB4:外部中断元EXT2的反馈管脚IOB364输入输出IOB3:外部中断元EXT2IOB265输入输出IOB2:外部中断元EXT1IOB166输入输出IOB1:串行借口的数据传送管脚IOB067IOB0:串行借口的时钟信号DAC112输出DAC1数据输出管脚DAC213输出DAC2数据输出管脚可将PFUSE接5V, PVIN接GND并维持1s以上即可将内部保险丝熔化,此后就无法读取和向闪存加载数据。SPCE061A系统的特性参数如表3-2 表3-2 PCE061A系统的特性参数特性参数Spce061a工作电压2.6V3.6V最大工作速率49.152MHzCPU16位nSPTMSRAM容量2K字ROM容量(字)32K闪存ROM并行I/O端口AIOA150并行I/O端口BIOB150音频输出方式DAC-2中断源TimerA/B时基信号发生器外部中断触键唤醒唤醒元IOA70其他中断源定时器/计数器双16位加计数定时器/计数器双通道PWM输出UART具备ADC7通道10位电压模-数转换器(ADC)和单通道声音模-数转换器(ADC)单行SRAM接口具备(凌阳格式)晶振具备低电压复位具备低电压监测具备内置ICE接口具备上电复位具备麦克风放大器和自动增益控制单通道节电功能具备中断控制功能具备触键唤醒功能具备3.2.4 SPCE061A最小系统最小系统接线如图3-4在OSC0、OSC1端接上晶振及谐振电容,在锁相环压控振荡器的阻容输入VCP端接上相应的电容电阻后即可工作。其它不用的电源端和地端接上0.1F的去藕电容提高抗干扰能力。图3-4 SPCE061A最小系统原理图3.2.5 SPCE061A开发方法SPCE061A的开发是通过在线调试器PROBE实现的。它既是一个编程器(即程序烧写器),又是一个实时在线调试器。用它可以替代在单片机应用项目的开发过程中常用的软件工具硬件在线实时。SPCE061A的开发是通过在线调试器PROBE实现的。它既是一个编程器(即程序烧写器),又是一个实时在线调试器。用它可以替代在单片机应用项目的开发过程中常用的软件工具硬件在线实时。真器和程序烧写器。它利用了SPCE061A片内置的在线仿真电路ICE(In- Circuit Emulator)接口和凌阳公司的在线串行编程技术。PROBE工作于凌阳IDE集成开发环境软件包下,其5芯的仿真图3-5是单片机机、PROBE、用户目标板三者之间的连接示意图;3-6为实物连接图。外围接口电路VDDXICEICELCKICESDAVSSVDDXICEICECLKICESDAVSS5V电源3.3V电源32768Hz晶振 Spce061a probe图3-5 用户目标版、probe、计算机三者之间的连接图图3-6 实物连接图3.3 SPCE061A 的外部存储器(Memory)的扩展3.3.1 综述随着数字语音,图象处理技术的飞速发展,其在电子产品中也得到广泛应用,如语音智能玩具、PDA以及有语音、图象识别技术的机器人。一个复杂或功能强大的语音,图象处理系统需要很大的,不同的存储器(ROM,FLASH,SRAM)的存储空间。那么系统如何扩展Memory,解决IO口不够的问题呢?这里介绍一款芯片-W29C040,它能够解决所有IO不够用的问题SPCE061A是台湾凌阳公司生产的十六位单片机,该单片机内置有2路DA转换,8路AD转换及在线仿真等丰富的功能,这些都为我们实现数码录音和播放提供良好的方便条件, W29C040是台湾华邦公司生产的4M位的FLASH存储芯片,利用它存储凌阳格式的语音资源,可以长达4分钟语音录放。该系统可以广泛应用于需求的录音较长的场合。如录音笔、自录语音提示等应用方案。本系统提供W29C040相关的读写模块,此模块也可应用于W29C040同系列的相关FLASH芯片中。3.3.2 W29C040的介绍W29C040为32脚DIP封装芯片,工作电压为5V,内部 512K * 8位的快速闪存,它的结构为256字节为一页,每页的擦写时间为5mS,整片擦除时间为50mS。管脚表如下:表3-3 管脚表管脚名称功能描述A0-A18地址的输入口DQ0-DQ7数据输入/输出口#CE片选脚#OE读脚#WE写脚Vdd5V脚Vss地3.3.3 W29C040写、擦除流程图3.3.3.1. 去掉写保护流程图去掉写保护流程图如图3-10图3-10 去掉写保护流程图3.3.3.2. 片擦除流程图片擦除流程图如图3-11图3-11 片擦除流程图3.3.3.3. 页写流程图页写流程图如图3-12图3-12 页写流程图3.3.3.4. 写结束判断流程图写结束判断流程图如图3-13图3-13 写结束判断流程图3.3.4 SPCE061A与W29C040的硬件连接图详细硬件连接图如图3-14图3-14 详细硬件连接图本系统硬件电路包括按键部分、音频录入部分、音频输出部分和W29C040存储扩展等四部分电路。音频录入部分详细电路图如图3-15。图3-15 音频录入部分电路原理图音频输出部分详细电路图如图3-16图3-16 音频输出部分原理图系统总原理图如图3-17及附录D图3-17 系统总原理图第 4 章 软件系统的设计与实现4.1 凌阳音频介绍4.1.1 音频概述我们所说的音频是指频率在20 Hz20 kHz的声音信号,分为:波形声音、语音和音乐三种,其中波形声音就是自然界中所有的声音,是声音数字化的基础。语音也可以表示为波形声音,但波形声音表示不出语言、语音学的内涵。语音是对讲话声音的一次抽象。是语言的载体,是人类社会特有的一种信息系统,是社会交际工具的符号。音乐与语音相比更规范一些,是符号化了的声音。但音乐不能对所有的声音进行符号化。乐谱是符号化声音的符号组,表示比单个符号更复杂的声音信息内容。4.1.2 数字音频的采样和量化将模拟的(连续的)声音波形数字元化(离散化),以便利数字计算机进行处理的过程,主要包括采样和量化两个方面。数字音频的质量取决于:采样频率和量化位数这两个重要参数。此外,声道的数目、相应的音频设备也是影响音频质量的原因。4.1.3 音频格式的介绍音频文件通常分为两类:声音文件和MIDI文件(1)声音文件:指的是通过声音录入设备录制的原始声音,直接记录了真实声音的二进制采样数据,通常文件较大;(2)MIDI文件:它是一种音乐演奏指令序列,相当于乐谱,可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件尺寸较小。4.1.4 语音压缩编码基础语音压缩编码中的数据量是指:数据量=(采样频率x量化位数)/8(字节数)x声道数目。压缩编码的目的:通过对资料的压缩,达到高效率存储和转换资料的结果即在保证一定声音质量的条件下,以最小的资料率来表达和传送声音信息。压缩编码的必要性:实际应用中,压缩编码的音频资料量很大,进行传输或存储资料量是不现实的。所以要通过对信号趋势的预测和冗余信息处理,进行资料的压缩,这样就可以使我们用较少的资源建立更多的信息。举个例子,没有压缩过的CD品质的资料,一分钟的内容需要11MB的内存容量来存储。如果将原始资料进行压缩处理,在确保声音品质不失真的前提下,将数据压缩一半,5.5MB就可以完全还原效果。而在实际操作中,可以依需要来选择合适的算法。常见的几种音频压缩编码:1)波形编码:将时间域信号直接变换为数字代码,力图使重建语音波形保持原语音信号的波形形状。波形编码的基本原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。译码是其反过程,将收到的数字序列经过译码和滤波恢复成模拟信号。如:脉冲编码调制(pulse code modulation,PCM)、差值脉冲编码调制(DPCM)、增量调制(DM)以及它们的各种改进型自适应差分编码(ADPCM)、自适应增量调制(ADM)、自适应差值脉冲编码调制(ADPCM) 、自适应传输编码(Adaptive Transfer Coding,ATC)和子带编码(SBC)等都属于波形编码技术。波形编码特点:高话音质量、高码率,适于高保真音乐及语音。2)参数编码:参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。参数编码特点:压缩比大,计算量大,音质不高,廉价!3)混合编码:混合编码使用参数编码技术和波形编码技术,计算机的发展为语音编码技术的研究提供了强有力的工具,大规模、超大规模集成电路的出现,则为语音编码的实现提供了基础。80年代以来,语音编码技术有了实质性的进展,产生了新一代的编码算法,这就是混合编码。它将波形编码和参数编码组合起来,克服了原有波形编码和参数编码的弱点,结合各自的长处,力图保持波形编码的高质量和参数编码的低速率。如:多脉冲激励线性预测编码(MPLPC),规划脉冲激励线性预测编码(KPELPC),码本激励线性预测编码(CELP)等都是属于混合编码技术。其数据率和音质介于参数和波形编码之间。总之,音频压缩技术之趋势有两个:1)降低资料率,提高压缩比,用于廉价、低保真场合(如:电话)。2)追求高保真度,复杂的压缩技术(如:CD)。4.2 凌阳音频编码算法表4-1为音频质量等级的编码技术标准(频响):表4-1中频率范围(Hz)采样率(kHz)量化精度(位)电话话音2003400 8 8 宽带音频(AM质量) 507000 16 16 调频广播(FM质量)2015k 37.8 16 高质量音频(CD质量) 2020k 44.1 16 凌阳音频压缩算法处理的语音信号的范围是200HZ3.4KHZ的电话话音。表4-1音频质量等级的编码技术标准(频响)信号类型频率范围(Hz)采样率(kHz)量化精度(位)电话话音200-340088宽带音频(AM质量)50-70001616调频广播(FM质量)20-15K37.816高质量音频(CD质量)20-20K44.1164.2.1 压缩分类压缩分无损压缩和有损压缩,无损压缩一般指:磁盘文件,压缩比低:2:14:1。而有损压缩则是指:音视频文件,压缩比可高达:100:1。凌阳音频压缩算法根据不同的压缩比分为以下几种(具体可参见语音压缩工具一节内容):SACM-A2000:压缩比为8:,8:1.25,8:1.5SACM-S480:压缩比为80:3,80:4.5SACM-S240:压缩比为80:1.54.2.2 凌阳常用的音频形式和压缩算法1)波形编码:sub-band即SACM-A2000特点:高质量、高码率,适于高保真语音音乐。2)参数编码:声码器(vocoder)模型表达,抽取参数与激励信号进行编码。如:SACM-S240特点:压缩比大,计算量大,音质不高,廉价!3)混合编码:CELP即SACM-S480特点:综合参数和波形编码之优点。除此之外,还具有FM音乐合成方式即SACM-MS01。4.2.3 凌阳语音的播放、录制、合成和辨识凌阳的SPCE061A是16位单片机,具有DSP功能,有很强的信息处理能力,最高时钟可达到49M,具备运算速度高的优势等等,这些都无疑为语音的播放、录放、合成及辨识提供了条件。凌阳压缩算法中SACM_A2000、SACM_S480、SACM_S240主要是用来放音,可用于语音提示,而DVR则用来录放音。对于音乐合成MS01,该算法较繁琐,而且需要具备音乐理论、配器法及和声学知识,所以对于特别爱好者可以到我们的网站去了解相关内容,这里只给出它的API函数介绍及程序代码的范例,仅供参考。对于语音辨识主要有以下两种:1)特定发音人识别SD(Speaker Dependent):是指语音样板由单个人训练,也只能识别训练人的语音命令,而他人的命令识别率较低或几乎不能识别。2)非特定发音人识别SI(Speaker Independent):是指语音样板由不同年龄、不同性别、不同口音的人进行训练,可以识别一群人的命令。语音识别电路基本结构如图4-1所示:滤除噪音预加重滤波器组PARCOR系数线性预测系数过零次数能量相关函数等模式匹配词典语音分析语音识别结果输出图4-1识别电路结构4.2.4 语音录入使用介绍SACM-DVR具有录音和放音功能,并采用SACM_A2000的算法,录音时采用16K资料率及8K采样率获取语音资源,经过SACM_A2000压缩后存储在扩展的SRAM 628128A里,录满音后自动开始放音。其相关API函数如下所示:int SACM_DVR_Initial(int Init_Index) /初始化 void SACM_DVR_ServiceLoop(void) /获取资料,填入译码队列 void SACM_DVR_Encode(void) /录音 SACM_DVR_StopEncoder(); /停止编码 SACM_DVR_InitEncoder(RceMonitorOn) /初始化解码器 void SACM_DVR_Stop(void) /停止录音 void SACM_DVR_Play(void) /开始播放 unsigned int SACM_DVR _Status(void) /获取SACM_DVR模块的状态 void SACM_DVR _InitDecode(void) /开始译码 void SACM_DVR _Decode(void) /获取语音资料并译码,中断播放 SACM_DVR_StopDecoder(); /停止解码 unsigned int SACM_DVR _ TestQueue(void) /获取语音队列状态 int SACM_DVR _Fetchqueue(void) /获取录音编码数据 void SACM_DVR_FillQueue(unsigned int encoded-data) /填充资料到语音队列,等待播放 int GetResource(long Address) (Manual) / 从资源文件里获取一个字型语音资料 中断服务函数: Call F_FIQ_Service_ SACM_DVR /playing Call F_IRQ1_Service_ SACM_DVR /recode 具体函数如下: 1) 【API格式】C:void SACM_ DVR _Initial(int Init_Index) ASM:R1= Init_Index Call F_ SACM_ DVR _Initial 【功能说明】SACM_ DVR语音播放之前的初始化:设置中断源、定时器以及播放方式(自动、手动) 【参数】Init_Index=0 表示手动方式;Init_Index=1 则表示自动方式。 【返回值】无 【备注】 对于SACM_DVR模块,需要一些I/O口来连接外部的SRAM,用以存放录音资料。 录放音的格式采用SACM_A2000。 2) 【API格式】C:void SACM_DVR_ServiceLoop(void) ASM:Call F_ SACM_DVR _ServiceLoop 【功能说明】在录音期间从ADC通道获取录音资料,且将其以SACM_A2000格式进行编码后存入外接SRAM中;而在播放期间从SRAM中获取语音资料,对其进行解码,然后等候中断服务子程序将其送出DAC通道。 【参数】无。 【返回值】无。 3)【API格式】C:void SACM_DVR_Encode(void); ASM:Call F_ SACM_DVR_ Encode 【功能说明】开始以自动方式录制声音资料到外接SRAM中。 【参数】无。 【返回值】无。 【备注】该函数仅适用于SACM_DVR模块,且只有自动方式。 4)【API格式】C:void SACM_DVR _Stop(void); ASM:Call F_ SACM_DVR _Stop 【功能说明】以自动方式停止录音。 【参数】无。 【返回值】无。 5)【API格式】 C:int SACM_DVR _Play(int Speech_Index, int Channel, int Ramp_Set); ASM:Call SACM_DVR _Play 【功能说明】以自动方式播放外接SRAM中的录音资料。 【参数】无 【返回值】无。 【备注】该函数仅使用于自动方式下。 6)【API格式】C:unsigned int SACM_DVR _Status(void); ASM:Call F_ SACM_DVR _ Status 返回值=R1 【功能说明】获取SACM_DVR模块的状态。 【参数】无。 【返回值】当R1中bit0=0,表示语音播放结束;bit0=1,表示语音在播放中。 SACM_DVR模块的状态返回值,如图4.2所示。 图4.2 SACM_DVR状态返回值 【备注】该函数仅使用于DVR的手动方式下。 7)【API格式】C:void SACM_DVR_InitDecode(int Channel); ASM:Call F_SACM_DVR_Decode 【功能说明】开始对SACM_DVR语音资料以非自动方式(编程控制)进行译码。 【参数】Channel=1,2,3;分别表示使用DAC1、DAC2信道以及DAC1和DAC2双通道。 【返回值】无。 【备注】用户只能通过非自动方式对语音资料解压缩。 8)【API格式】C:void SACM_DVR_Decode(void); ASM:Call F_ SACM_DVR_Decode 【功能说明】从语音队列里获取的SACM_DVR语音资料,并进行译码,然后通过中断服务子程序将其送入DAC通道播放。 【参数】无。 【返回值】无。 【备注】用户仅能通过非自动方式对语音资料进行译码。 9) 【API格式】C:unsigned int SACM_DVR_TestQueue(void); ASM:Call F_SACM_DVR_TestQueue 返回值=R1 【功能说明】获取语音队列的状态。 【参数】无。 【返回值】R1=0,语音队列不空不满 =1,语音队列满 =2;语音队列空。 【备注】用户仅能通过非自动方式测试语音队列状态。10) 【API格式】C:int SACM_DVR _FetchQueue(void); ASM:Call F_SACM_DVR _FetchQueue Return_Value=R1 【功能说明】获取录音编码(SACM_A2000)数据。 【参数】无。 【返回值】16位录音资料。 【备注】 采用-SACM_A2000编码格式编码 仅用于非自动方式下 程序1-1 外扩SRAM需要SRAM写初始化(InitWriteSRAM),及写(WriteSRAM) 子函数。 SACM_DVR_Initial(Manual); Addr=0; InitWriteSRAM(); /用户需外接SRAM SACM_DVR_InitEncoder(); while(AddrSRAM_Size) SACM_DVR_Encode(); /获取数据并译码 If(SACM_DVR_Tes

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论