SPCE061A单片机的机器人设计说明

上传人:痛*** 文档编号:85658819 上传时间:2022-05-06 格式:DOC 页数:37 大小:537.50KB
收藏 版权申诉 举报 下载
SPCE061A单片机的机器人设计说明_第1页
第1页 / 共37页
SPCE061A单片机的机器人设计说明_第2页
第2页 / 共37页
SPCE061A单片机的机器人设计说明_第3页
第3页 / 共37页
资源描述:

《SPCE061A单片机的机器人设计说明》由会员分享,可在线阅读,更多相关《SPCE061A单片机的机器人设计说明(37页珍藏版)》请在装配图网上搜索。

1、20XX度本科生毕业论文设计基于SPCE061A单片机的机器人设计学 院: 电子信息工程学院 专 业: 电子信息科学与技术 年 级: 2007级 学生: 转转 学 号:导师及职称: 心武实验师 20XX1月2011 Annual GraduationThesis oftheCollegeUndergraduate Microcontroller-based robot design SPCE061ADepartment:College of Electronics and Information EngineeringMajor: Electronic InformationScience a

2、nd TechnologyGrade:2007Students Name:Liu ZhuanzhuanStudent No.:Tutor: Zheng XinwuTechnicianJanuary,2011毕业论文设计原创性声明本人所呈交的毕业论文设计是我在导师的指导下进行的研究工作及取得的研究成果。据我所知,除文中已经注明引用的容外,本论文设计不包含其他个人已经发表或撰写过的研究成果。对本论文设计的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意。 作者签名: 日期:毕业论文设计授权使用说明本论文设计作者完全了解琼州学院有关保留、使用毕业论文设计的规定,学校有权保留论文设计并向

3、相关部门送交论文设计的电子版和纸质版。有权将论文设计用于非赢利目的的少量复制并允许论文设计进入学校图书馆被查阅。学校可以公布论文设计的全部或部分容。的论文设计在解密后适用本规定。 作者签名: 指导教师签名:日期: 日期: 转转 毕业论文设计答辩委员会成员职称单位备注主席组长29 / 37摘 要凌阳16位SPCE061A单片机嵌32K字闪存,2K字SRAM,置10位ADC、DAC,有多达14个的中断源。它的CPU核采用16位具有DSP功能的微处理器芯片,而且CPU可最高工作在49MHz的主频下,能够非常容易地、快速地处理复杂的数字信号,因此与其他类型的单片机相比,在数字语音处理方面SPCE061

4、A更具有优势。当今,机器人的发展越来越趋于智能化和人性化,语音是人和机器人之间交流的最自然、最方便的手段之一。语音识别的目的是通过语音,使机器人了解人的意思从而执行相应的命令,完成相应的动作。实现了机器人的智能性和先进性。基于以上机器人的发展方向,该设计制作了一个以凌阳单片机为核心的智能机器人软件系统。系统主要包括语音识别模块,语音播放模块以及机器人动作控制模块。该系统利用凌阳单片机在数字信号处理及语音处理方面的优越性,通过语音辨识技术,可以让机器人在语音指令控制下实现前进,后退,跳舞,发射以及连续发射飞盘等多种功能。经过训练,训练人可使用各种命令让机器人完成许多有趣的动作,使得人机交互更具智

5、能化。关键词:SPCE061A单片机;机器人;语音识别ABSTRACTSunplus 16-bit SPCE061ASCM is embedded with 32K word Flash and 2K word SRAM,with built-in 10-bit ADC and DAC as well as more than 14 interrupt sources. The core of its CPU is a 16-bit microprocessor chip which has the function of DSP. Besides,the CPU can work with

6、a frequency up to 49MHz,and process complex digital signals easily and quickly. Therefore,compared with other types of SCM,SPCE061A has more advantages in speech processing.Today,the development of robots become more and more intelligent and humane,and the voice is the most natural communication bet

7、ween the robot,the most convenient means. The purpose of speech recognition by voice,so that people understand the meaning of the machine to perform the appropriate order,complete the appropriate action. Realize intelligent robots and advanced. Based on the above direction of the robot,which designe

8、d a microcontroller core with Sunplus intelligent robot software system. System includes voice recognition module,the voice playback module and the robot motion control module. The system uses Sunplus microcontrollers in digital signal processing and speech processing advantages,through voice recogn

9、ition technology allows voice commands to control the robot to achieve forward,backward,dancing,launch and continuously firing Frisbee and other features. After training,the training of people can use various commands to the robot to complete a number of interesting action,making more intelligent hu

10、man-computer interaction.Keywords: SPCE061ASCM ; Robot ; Speech Recognition目 录前言1第一章系统总体方案设计2第二章硬件系统设计32.1 SPCE061A的简介32.1.1 概述32.1.2 SPCE061A结构图32.1.3 芯片性能42.1.4 SPCE061A 最小系统52.1.5 适用于语音信号处理的主要特点52.2 机器人62.2.1 主要功能:62.2.2 实物图62.2.3 注意事项62.2.4 硬件驱动电路72.3组装82.3.1 机器人线路的辨认82.3.2 机器人电机线路、电源线路与驱动电路板的连接

11、8第三章系统软件设计103.1程序分析103.1.1 擦除Flash模块103.1.2 位操作模块103.1.3 语音播放函数103.1.4 走路、跳舞等其它函数模块113.2 API函数的介绍123.2.1 初始化过程123.2.2 训练过程133.2.3 识别过程133.2.4 其它语音识别API介绍143.3 下载程序并调试检测15第四章语音识别技术184.1 语音识别基本原理184.2 语音合成技术18结束语19参考文献20附表A 程序流程图22附录B23致谢30前 言近年来,消费类电子产品中智能化趋势日益明显,其中语音识别技术的应用起到了关键的作用 。从实现手段看,当前以电子技术为基

12、础实现语音识别可以利用单片机数字信号处理或语音识别专用集成电路芯片来完成从设计成本功能实现程度等综合来看,利用单片机来实现语音识别是一种高性价比的方法。随着科学技术的快速发展和人们物质生活水平要求的提高,机器人已经渐渐地融入人们生活的各个领域,去代替或者协助人们去完成高危,繁琐或者帮助残障人群的工作。语音识别是人机接口设计的一项重要容,也是语音信号处理中非常重要的应用技术,正逐步成为信息技术中人机交互的关键技术。目前,语音识别技术己经在诸多领域得到应用。随着信息产业的迅速发展,包括计算机、办公自动化、通信、国防、机器人在的各个领域,都迫切需要采用语音识别技术来改变极其不方便的人机接口方式。语音

13、识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的一种技术,其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。把这种具有语音信息处理能力的机器和设备纳入人的语音交互对象,使之像人一样具备听、说、写功能,能对语音做出理解和反应,并在交互方式上不受时间和地点的限制,这是研究机器人语音识别的重大意义。将语音识别技术引入机器人领域解决人机交流障碍势在必行。在这种趋势的引领下,各国纷纷加大语音机器人的研发力度,并出现了一批高智能的语音机器人。我国在语音机器人领域发展进步很快,如凌阳智能语音识别机器人,以凌阳单片机SPCE061A为核

14、心,改装市场上的玩具机器人,使改装后的机器人具有语音识别能力,通过语音命令对其进行控制,这也正是本课题所研究的。提高了语音信息处理速度,可以快速对语音进行应答。采用了先进的非特定人语音识别技术,对口音和噪声不敏感。更加入了独有的噪声检测技术,当环境噪声很大时,能给用户相应的提示;并且加入了可信度评估和拒识技术,对于命令以外的语音或者干扰声音可以拒识。在语音交流的过程中,抗噪音能力得到了很大的提高。随着语音识别技术与机器人技术的进一步结合,未来高智能的人机交流将不是梦想。第一章 系统总体方案设计机器人共有五个直流电机。除发射电机和推进电机外,其它三个电机均是正反两用电机,即加在电机驱动端的两路输

15、入为高低电平时电机转动,改变输入高低电平的顺序,电机反向转动,这样可以控制机器人的前进,后退,左右摇头等双向动作。发射电机和推进电机的转动方向是固定的。发射电机的转速较高,高速的旋转带动转盘依靠摩擦力把飞盘发射出去。推进电机的任务就是把发射所需要的飞盘从存储仓输送到发射转盘位置。它依靠的是电机带动一个机簧的机械装置。电机转动一圈,机簧就会弹射一下,从而完成输送飞盘的任务。用61板来控制机器人,使用了IOB7-IOB15 资源,另外使用了扬声器。如图 1.1 所示:图1.1 系统的总体框图系统主要由61 板与机器人驱动电路构成。61 板作为整个系统的主控板,驱动电路驱动电机在主控板61 板的控制

16、下完成各个动作。另外增加了特定人语音识别的功能,通过命令来控制机器人,使机器人智能化。第二章 硬件系统设计2.1 SPCE061A的简介2.1.1 概述SPCE061A是凌阳科技公司研制的一个16位结构的微控制器。它的核采用本公司最新推出的16位微处理器芯片。SPCE061 A既具有体积小、集成度高、可靠性好的特点,又具有较强的中断处理能力、高性能的价格比和功能强、效率高的指令系统及低功耗、低电压的特点,以unSP 为核心的SPCE061A 微控制器是适用于数字语音识别应用领域产品的一种最经济的选择。2.1.2 SPCE061A结构图SPCE061A 的结构如图 2.1所示:图2.1 SPCE

17、061A的结构 2.1.3 芯片性能SPCE061A的主要性能特点如下:16位unSP微处理器;CPU的工作电压为2.6V-3.6V,I/O的VDDH为3.0V-5.5V;CPU时钟为0.32MHz-49.152MHz;置2k字SRAM;置32K字Flash存储器;可编程音频处理;晶体振荡器;系统处于备用状态下,耗电小于2uA/3.6V;2个16位可编程定时器/计数器;2个10位DAC输出通道;16位通用可编程输入/输出端口;14个中断源可来自定时器AB,时基,2个外部时钟源输入,键唤醒;具备触键唤醒的功;锁相环PLL振荡器提供系统时钟信号;32768Hz实时时钟;7通道10位电压模-数转换和

18、单通道声音模-数转换器;声音模-数转换器输入通道置麦克风放大器和自动增益控制功能;具备串行设备接口;低电压复位功能和低电压监测功能;置在线仿真电路接口ICE ;具有能力;具有WatchDog功能;可编程音频处理,使用凌阳音频编码SACM_S240方式,能容纳210s的语音数据。2.1.4 SPCE061A 最小系统SPCE061A最小系统当中,包括SPCE061A芯片外围的基本模块,有:晶振输入模块OSC、锁相环外围电路PLL、复位电路RESET、指示灯LED等,如图2.2所示。图2.2 SPCE061A 最小系统2.1.5 适用于语音信号处理的主要特点SPCE061A除了具有集成度高、性能可

19、靠、价格低廉的特点外,在A/D和D/A中都设有针对语音信号处理的功能,若把A/D,D/A转换接口与其核unSP的DSP运算功能配合使用,就可方便地实现语音识别功能,从而使其能更好地用于声控和语音识别领域。2.2 机器人2.2.1主要功能:通过语音命令对其进行控制;可以跳两首舞曲;走步功能、转向功能、转头功能;发射飞盘功能;2.2.2 实物图图2.3 机器人实物图2.2.3 注意事项机器人在发射飞盘时不要面向人,避免受伤;机器人要轻拿轻放,应该避免摔打;在安装电池时注意正负极,否则容易烧坏机器人电机或主控制板。2.2.4 硬件驱动电路机器人硬件原理图如图2.4所示:左右腿、脖子电机驱动加速度、发

20、射电机驱动图2.4 机器人驱动电路原理图机器人驱动电路采用功率较大的三极管搭成H 桥来驱动电机,可以实现电机的正向旋转与电机的反向旋转。这些电机包括2 个用于走路的电机与一个头部转向的电机。另外用了一个三极管驱动单向旋转的电机,包括加速电机与发射电机,驱动电路比较简单。2.3组装2.3.1 机器人线路的辨认需要改装的控制线共有14条,10根电机连线、2根眼睛连线、2根喇叭连线。可以根据颜色和部位辨别线路的作用,下面分别介绍:该机器人载体共有5个电机,腿部有2个电机,控制机器人的行走方向;胸部有1个电机,控制机器人的头部转向;头部有2个电机,1个是加速电机,1个是发射电机,配合使用可以发射簧片。

21、5个电机共有10条连线。腿部电机:粉色或相近颜色和黑色一组,蓝色和浅蓝色或相近颜色一组。胸部电机:红色和黑色的连线。头部发射电机:蓝色和浅蓝色连线。头部加速电机:一般是黑色和绿色的连线,或棕色和绿色的连线。眼睛连线:白色和土黄色的连线。喇叭连线:两条粉色的连线。电源连线:红色的是正极,黑色的是负极。2.3.2 机器人电机线路、电源线路与驱动电路板的连接驱动电路板上面一排焊孔就是电机与驱动电路板的接口。其中标号的意义为:M表示Motor,电机的意思,L表示Left,左边,M_L1合起来就是左腿电机的意思,同理M_L2是另一条左腿电机连线。根据前面辨认,左腿电机是粉色和黑色两根连线,具体是粉色接M

22、_L1还是黑色接M_L1将影响电机的正转还是反转,根据控制信号需要连接。中间的标号VCC与M_J1是连接加速电机的两个接口。该电机是单向电机,只可以向一个方向旋转。根据前面电机连线的辨认,该电机是黑色和绿色的连线或者是棕色和绿色的连线,一般黑色或棕色的连线接VCC,绿色的连线接M_J1。下面列出标号意义,按照从左向右的顺序:EYE_N眼睛接口,接眼睛的负极连线白色;IOB12眼睛接口,接眼睛的正极连线土黄色;M_F1发射电机接口,接蓝色连线;VCC发射电机接口,接淡蓝色连线;M_J1加速电机接口,接绿色连线;VCC加速电机接口,接黑色或棕色连线;M_T1旋转电机接口,接旋转电机的一根连线;M_

23、T2旋转电机接口,接旋转电机的另一根连线;M_R1右腿电机接口,接右腿电机的一根连线;M_R2右腿电机接口,接右腿电机的另一根连线;M_L1左腿电机接口,接左腿电机的一根连线;M_L2左腿电机接口,接左腿电机的另一根连线。焊接完毕,机器人按拆的反过程装上,把电池盒盖稍作处理,固定背板,在背板上固定61板,组装就完成了。第三章 系统软件设计3.1 程序分析在主函数中调用相关函数完成特定人语音的训练,然后再训练成功后进行语音识别,根据识别的命令执行相关的操作。程序流程图见附表A。3.1.1擦除Flash模块判断是否为第一次下载根据FLASH中的标志位来进行判断。将训练好的语音模型导出存储到FLAS

24、H中使用库函数BSR_ExportSDWord;进行操作,然后再调用读写FLASH中的函数进行。在进行语音识别时,首先读取FLASH 将语音模型取得,然后调用BSR_ImportSDWord;函数将语音资源载入存。在识别出命令后,执行相关动作,相关动作操作就是操作电机的正向或反向旋转同时配合延时与播放声音组合起来形成不同的动作。3.1.2 位操作模块由于SPCE061A没有位操作指令,而在程序控制电机的时候需要经常操作某一位,为了方便程序的编写,增强可读性,编写了位操作模块。函数voidSet_IOB_Bit;参数依次为IO的位、Dir、Attrib、Data、Buffer例如操作IOB11为

25、同相低电平输出为Set_IOB_Bit。3.1.3 语音播放函数停止语音播放调用语音播放初始化函数调用语音播放准备播放函数清看门狗调用语音播放系统服务函数返回判断语音播放是否结束YN开始图3.1 SACM_S480自动播放流程图在本系统的软件设计当中,将语音播放的程序设计为语音播放模块,可方便地调用;语音播放程序分为两部分,一是播放流程控制,一是中断播放服务程序。播放控制流程图如上图3.1所示.3.1.4 走路、跳舞等其它函数模块这些函数就是控制电机的通与断的组合完成不用的动作,在需要的时候播放语音,实现一定的效果,具体请参考函数原形。在一般动作中,控制电机的正转或者反转就可以了。比如左腿向前

26、走,那么控制左腿的电机正向旋转就可以了;如果左腿向后走,那么只要控制电机向相反方向旋转就可以了。机器人眼睛点亮,只要IOB12口送高电平就可以完成。只有跳舞动作稍微复杂了一点,在跳舞动作中采用语音与动作同时进行的方法。将语音资源分成小段,播放一点语音,执行一点动作,然后再播放语音。将语音分成小段的目的就是便于调整机器人动作,否则播放语音时不能调整机器人的动作,这样机器人的动作就单调了。在整个函数中对IO口操作用到了2种方法,一种是使用指针直接操作IO口,这种方法在频繁修改IO口的位时显得麻烦,但是在一般操作的时候比较好用。另一种方法就是调用函数对IO口进行位操作,这里调用的函数为Set_IOB

27、_Bit;第一个参数为需要对IO口的哪个位进行操作,然后参数依次为操作IO口的Dirretory、Attribion、Data、Buffer。3.2 API函数的介绍SPCE061A实现语音识别的步骤,分为训练部分与识别部分,以及在训练、识别过程中中断的情况,如图3.2。开始初始化RAM执行训练,获得训练结果训练成功返回开始定时采集语音样本返回语音特征模型开始初始化识别器获得识别结果识别出语音命令执行相应操作返回YNNY中断服务识别过程识别过程训练过程图3.2 语音识别的实现3.2.1 初始化过程API格式C:int BSR_DeleteSDGroup功能说明SRAM初始化。参数该参数是辨识的

28、一个标识符,0代表选择SRAM,并初始化。返回值当SRAM擦除成功返回0,否则返回1。备注语音命令的特征模型是通过BSR_Train函数保存在RAM空间中的。如果所需的RAM空间已被旧的特征模型数据占满,新特征模型则无法保存到RAM中。利用BSR_DeleteSDGroup函数可以把RAM空间中所有的特征模型删除,释放出所需空间。3.2.2 训练过程API格式C:int BSR_Train功能说明训练函数。参数CommandID:命令序号,围从0x100到0x105,并且对于每组训练语句都是唯一的。TraindMode:训练次数,要求使用者在应用之前训练一或两遍:BSR_TRAIN_ONCE表

29、示要求训练一次。BSR_TRAIN_TWICE表示要求训练两次。返回值训练成功,返回0;没有声音,返回-1;需要更多的语音数据来训练,返回-2;当环境太吵时,返回-3;当数据库满,返回-4;当两次输入命令不同,返回-5;当序号超出围,返回-6。备注在调用训练程序之前,确保识别器正确的初始化;训练次数是2时,则两次一定会有差异,所以一定要保证两次训练结果接近;为了增强可靠性,最好训练两次,否则辨识的命令就会倾向于噪音;调用函数后,等待12秒开始训练,每条命令只有1.3秒,也就是说,当训练命令超出1.3秒时,只有前1.3秒命令有效。3.2.3 识别过程API格式C:void BSR_InitRec

30、ognizer功能说明辨识器初始化。参数该参数定义语音输入来源,通过MIC语音输入还是LINE_IN电压模拟量输入。返回值无。API格式C:int BSR_GetResult功能说明辨识中获取数据。参 数无。返回值当无命令识别出来时,返回0;识别器停止、未初始化或识别未激活返回1;当识别不合格时返回2;当识别出来时返回命令的序号。备注该函数用于启动辨识。API格式C:void BSR_StopRecognizer功能说明停止辨识。参数无。返回值无。备注该函数是用于停止识别,当调用此函数时,FIQ_TMA中断将关闭。中断过程:API格式ASM:_BSR_FIQ_Routine功能说明在中断中调用

31、。参数无。返回值无。备注该函数在中断FIQ_TMA中调用;当主程序调用BSR_InitRecognizer时,辨识器便打开8K采样率的FIQ_TMA中断并开始将采样的语音数据填入辨识器的数据队列中;应用程序需要设置一下程序段在FIQ_TMA中。3.2.4 其它语音识别API介绍BSR_PauseRecognizer暂停识别,但不释放中断等资源BSR_ResumeRecognizer恢复被暂停的识别BSR_GetRecognizerScore获得识别结果的可信度,返回值从-4096到4096,数值越大表示输入语音与特征模型的匹配度越高。BSR_EnableCPUIndicator开启CPU状态监

32、测功能。开启该功能后,IOA0和IOA1将发出每16ms电平变化一次的方波。BSR_DisableCPUIndicator关闭CPU状态监测功能。BSR_ExportSDWord使用函数库时,会自动创建一个100Word的数组BSR_SDModel100,可以把某条训练命令的特征模型数据导出到这个数组中。BSR_ImportSDWord可以把BSR_SDModel 数组中的数据导入为某条语音命令的特征模型。unsigned int BSR_SDModel;配合BSR_ExportSDWord与BSR_ImportSDWord函数使用,此数组的作用相当于一个暂时的存储区。3.3 下载程序并调试检

33、测验证应用方案的步骤步骤一:启动unSP IDE。打开机器人应用实例程序,编译、确认没有错误。如图3.3所示:图3.3 编译、图步骤二:下载程序代码到机器人的61板上。步骤三:打开机器人的电源,进行语音训练,训练过程按照下面进行:按顺序训练以下15条指令:名称,开始,准备,跳舞,再来一曲,开始,向前走,倒退,右转,左转,准备,向左瞄准,向右瞄准,发射,连续发射。每条指令要训练两遍。当一条指令被正确识别时会提示进入下一条;如没有被识别会要求重复该指令,直到正确识别为止。步骤三如果训练成功则进入语音识别状态,如果训练没有成功则重复训练。由于SPCE061A的FLASH存储器只有32K,所以15条指

34、令需要分组存放。在这里分成3组,每组5条指令。在不同组指令中交换需要根据出发名称,所以在识别状态,要执行动作首先需要出发名称,就是训练的第一条命令,然后可以识别第一组的其余四条命令。在触发第一条指令,然后再触发第二条指令,就可以识别第三条指令,参考3.6图:名称再来一曲开始准备跳舞左转右转向前走倒退向左瞄准发射连续发射向右瞄准图3.4 机器人操作示意图第四章 语音识别技术4.1 语音识别基本原理语音识别基本原理:预处理,语音信号数字化。特征提取,抽取反应语音本质的特征参数,形成特征矢量序列。语音模型库,从一个或多个讲话者多次重复讲话中提取的语音参数模板。模式匹配,把输入语音的特征参数与语音模型

35、库进行比较分析,得到识别结果。语音识别基本原理图如下图4.1:预处理特征提取模式匹配后处理主意模型库输入语音识别训练初步识别结果识别结果图4.1 语音识别基本原理4.2 语音合成技术将以其他方式表示或存储的信息转换成语音。最常见的语音合成技术是将文本转换为语音TTS。图4.2是文本到语音的转换过程:文本处理韵律处理语音合成词典及语言规范语音数据库合成语音输出文本输入图4.2 从文本到语音转换过程示结束语本文通过对语音识别技术的研究,结合凌阳单片机对语音资源的特有的支持,设计实现了处理器对人的语音识别功能,并将单片机作为遥控智能机器人的微处理器,使遥控控制变身为人的语音识别控制,该机器人通过实现

36、的训练,就能够识别指定的语音命令,如:前进、后退、左转、右转、唱歌、跳舞、左右瞄准等近15 条语音命令,然后由微处理器解析收到的相应指令,驱动相应的电机,使机器人执行相应的动作,具备较好的交互性和娱乐性。系统只用了单颗SPCE061A芯片来完成语音处理和控制功能,与专用的语音处理芯片相比,具有结构简单、成本低、易实现的特点,并且凌阳科技公司提供了丰富的C函数库和语音处理函数库,供调用,缩短了开发周期。由于时间仓促,系统的设计没能很好的拓展创新,机器人的舞步舞曲及其它动作还需进一步的改进!本品稍作改动,就可以用来控制空调机、录像机等电器;利用SPCE061A的语音处理优势可组成语音应答系统、语音

37、合成系统、互动式玩具等,具有广阔的市场前景。参考文献1罗亚非.凌阳16位单片机应用基础M.:航空航天大学,20032玉贤基于SPCE061A单片机的语音识别系统的研究M,20043麟家用机器人语音识别及人机交互系统的研究M,20074守轩.轮椅机器人语音识别控制系统的研究与实现M,20075王雪松,田西兰,王炜强.语音识别技术在机器人控制中的应用N.仪器仪学报,2006,66凌阳科技大学计划.机器人使用说明书Z.:航空航天大学,20057凌阳科技大学计划.机器人改装流程_使用新驱动板V1.1Z.:航空航天大学,20058凌阳科技大学计划.凌阳单片机在大学生电子竞赛中的应用Z.:航空航天大学,2

38、0059定远,马洪江.16位单片机及语音嵌入式系统M.:中国水利,200610晓静,罗永革,珂璐等.基于AMT直流电机的H桥驱动电路硬件研制J.汽车工业学院学报,200711王慧,王超,俊波.基于语音识别机器人的研究M.世界科技研究与发展,200912严一岩.语音集成电路概述J.电子世界,199713双龙.智能机器人语音识别对话与控制J.电子世界,200414黄淞,蒋雪峰,文杰等.智能语音识别避障机器人的研究与设计J.应用科技,200215Zili Zhou Chris K.Modeling of Configuration-Dependent Flexible Joints for a Pa

39、rallel Robot. Advances in Mechanical Engineering,200916罗志增,敬斌.机器人语音控制及其实现J电子T业学院学报,200417ZbanciocM,costinM.Using neural networks and LPCC to improve speech recognition singalsJ.Proceedings of the International symposium on ciucuits and Systems,200318SU JAY Phadke,RH ISH I KESH Limaye,SIDDHARTHVerma,

40、eta.l On Design and Implementation ofan Embedded Automatic Speech Recognition SystemC/Proceedings of the 17th International Conference on VLSI Design,Washington,DC,USA:IEEE Computer Society,2004: 127-132.19BANBROOK M,MCLAUGHLINS ,MANN I SpeechCharacterization and Synthesis by Nonlinear MethodsJ.IEEE

41、 Trans.on Speech and Audio Proc,1999,7: 1-17.附表A 程序流程图开始初始化IOB口语音训练与存储置相关标志位语音识别初始化擦除指定的FLASH判断是否为第一次下载 是否为触发状态是否为触发名称判断是第几组命令设置触发判断是第几条命令判断是第几条命令判断是第几条命令播放应答导出第二组命令导出第三组命令跳舞再来一曲播放应答向前走向后走左转右转播放应答向左瞄准向右瞄准发射连续发射训练是否超时Key3键是否按下消除触发标志擦除FLASH标志NYNYYNNNYY第一组命令第二组命令第三组命令附录BImproved speech recognition meth

42、odfor intelligent robotOverview of speech recognitionSpeech recognition has received more and moreattention recently due to the important theoreticalmeaning and practical value 5Up to now,mostspeech recognition is based on conventional linear system theory,such as Hidden Markov Model and Dynamic Tim

43、e WarpingWith the deepstudyof speech recognition,it is found that speech signal is a complex nonlinearprocessIf the study ofspeech recognition wants to break through,nonlinear-system theory method must be introduced to itRecently,with the developmentof nonlinea-system theories such as artificial neu

44、ral networks,chaosand fractal,it is possible to apply these theories tospeech recognitionTherefore,the study of this paperis based onANN and chaos and fractal theories are introduced to process speech recognitionSpeech recognition is divided into two ways thatare speaker dependent and speaker indepe

45、ndentSpeaker dependent refers to the pronunciation modeltrained by a single person,the identification rate of thetraining person?sorders is high,while othersorders isin low identification rate or cant be recognizedSpeaker independent refers to the pronunciation modeltrained by persons of different a

46、ge,sex and region,itcan identify a group of personsordersGenerally,speaker independent system ismorewidely used,sincethe user is not required to conduct the trainingSo extraction of speaker independent features from thespeech signal is the fundamental problem of speakerrecognition systemSpeech recog

47、nition can be viewed as a pattern recognition task,which includes training and recognitionGenerally,speech signal can be viewed as a time sequence and characterized by the powerful hiddenMarkovmodel Through the feature extraction,thespeech signal is transferred into feature vectors and actasobservat

48、ionsIn the trainingprocedure,these observationswill feed to estimate the model parameters ofHMMThese parameters include probability densityfunction for the observations and their correspondingstates,transition probability between the states,etcAfter the parameter estimation,the trained models canbe

49、used for recognition taskThe input observationswill be recognized as the resulted words and the accuracy can be evaluatedTheory andmethodExtraction of speaker independent features fromthe speech signal is the fundamentalproblemof speaker recognition systemThe standard methodology forsolving this pro

50、blem uses Linear Predictive CepstralCoefficientsandMel-Frequency Cepstral Co-efficientBoth these methods are linear procedures based on the assumption that speaker featureshave properties caused by the vocal tract resonancesThese features form the basic spectral structure of thespeech signalHowever,

51、the non-linear information inspeech signals is not easily extracted by thepresentfeature extraction methodologiesSo we use fractal dimension to measure non2linear speech turbulenceThis paper investigates and implements speaker identification system using both traditionalLPCC and non-linearmultiscale

52、d fractal dimension feature extraction33Improved feature extractions methodConsidering the respective advantages on expressing speech signal of LPCC and fractal dimension,we mix both to be the feature signal,that is,fractal dimension denotes the self2similarity,periodicity and randomness of speech t

53、ime wave shape,meanwhile LPCC feature is good for speech quality and high on identification rateDue to ANNs nonlinearity,self-adaptability,robust and self-learning such obvious advantages,its good classification and input2output reflection ability are suitable to resolve speech recognition problemDu

54、e to the number of ANN input nodes being fixed,therefore time regularization is carried out to the feature parameter before inputted to the neural network9In our experiments,LPCC and fractal dimension of each sample are need to get through the network of time regularization separately,LPCC is 4-fram

55、e data,fractal dimension is regularized to be12-frame data,so that the feature vector of each sample has 4*14+1*12=68-D,the order is,the first 56 dimensions are LPCC,the rest 12 dimensions are fractal dimensionsThus,such mixed feature parameter can show speech linear and nonlinear characteristics as

56、 wellArchitectures and Features of ASRASR is a cutting edge technology that allows a computer or even a hand-held PDA to identify words that are read aloud or spoken into any sound-recording deviceThe ultimate purpose of ASR technology is to allow 100% accuracy with all words that are intelligibly s

57、poken by any person regardless of vocabulary size,background noise,or speaker variables However,most ASR engineers admit that the current accuracy level for a large vocabulary unit of speech remains less than 90% Dragons Naturally Speaking or IBMs ViaVoice,for example,show a baseline recognition acc

58、uracy of only 60% to 80%,depending upon accent,background noise,type of utterance,etcMore expensive systems that are reported to outperform these two are Subarashii ,EduSpeak ,Phonepass ,ISLE Project and RAD ASR accuracy is expected to improve Among several types of speech recognizers used in ASR products,both implemented and proposed,the Hidden Markov Model is o

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!