【matlab代做】神经网络手写数字识别文献综述剖析

上传人:零** 文档编号:78656811 上传时间:2022-04-22 格式:DOC 页数:7 大小:340KB
收藏 版权申诉 举报 下载
【matlab代做】神经网络手写数字识别文献综述剖析_第1页
第1页 / 共7页
【matlab代做】神经网络手写数字识别文献综述剖析_第2页
第2页 / 共7页
【matlab代做】神经网络手写数字识别文献综述剖析_第3页
第3页 / 共7页
资源描述:

《【matlab代做】神经网络手写数字识别文献综述剖析》由会员分享,可在线阅读,更多相关《【matlab代做】神经网络手写数字识别文献综述剖析(7页珍藏版)》请在装配图网上搜索。

1、基于神经网络的手写体数字识别系统1 前言自1946年第一台计算机面世以来,让电脑能说会看,能写会画,使人与计算机的交流更加充分融洽,就成为电脑专家们努力追求的目标。其中计算机的输入技术也由最早的磁带输入到键盘鼠标操作,然而,笔输入的更加直观方便使之成为每个人的梦想。1987年,美国电气和电子工程师学会IEEE(institute for electrical and electronic engineers)在圣地亚哥召开了盛大规模的神经网络国际学术会议,国际神经网络学会(international neural networks society)也随之诞生。1990年IEEE神经网络会刊问世

2、,各种期刊的神经网络特刊层出不穷,神经网络的理论研究和实际应用进入了一个蓬勃发展的时期1。目前关于人工神经网络的定义尚不统一2,例如,美国神经网络学家Hecht Hielsen关于人工神经网络的一般定义是:“神经网络是由多个非常简单的处理单元彼此按某种方式相互连接而形成的计算系统,该系统是靠其状态对外部输入信息的动态响应来处理信息的”。综合人工神经网络的来源、特点及各种解释,可以简单表述为:人工神经网络是一种旨在模仿人脑结构及其功能的脑式智能信息处理系统。神经网络经过训练可有效地提取信号、语音、图像、雷达、声呐等感知模式的特征,并能解决现有启发式模式识别系统不能很好解决的不变量探测、自适应、抽

3、象或概括等问题。2 手写体数字识别系统的现状2.1手写体数字识别手写体字符的识别是多年来的研究热点,在过去的数十年中,研究者们提出了许许多多的识别方法。数字识别问题是根据待识别数字符号的特征观察值将其分类到0-9共10个类别中去。手写体数字识别方法大致可以分为两类3:基于统计的识别方法和基于结构的识别方法。统计法所使用的技术大致有一下几类:1) 模板匹配法2) 从像素点统计分布的角度来抽取特征,主要的方法有:采样点方法,矩方法、特征轨迹方法等。3) 用全局变换和级数展开的方法抽取特征。全局变换和级数展开可以减少特征向量的维数,且对于一些全局的形变,如平移和旋转,具有一定的不变性。上述统计方法中

4、,对仅使用单个特征的分类器而言,其识别率还不够高。对结构方法而言,它一般是通过分析字符的轮廓或骨架来取得字符的几何和拓扑特征,如环路、端点、弧状线及凹凸性等等。一般来说,结构方法有较高的识别速度,而且对于字符的变形具有良好的抗干扰能力,同时对字符的旋转,平移和伸缩具有较好的稳定性,但是这种方法的特征抽取过程比较复杂,由于特征定义和抽取都直接依赖于研究者的直觉,对图像预处理要求较高。2.2识别系统的性能评价 作为一个识别系统,最终要用某些参数来评价其性能的高低,手写数字识别也不例外。评价的指标除了借用一般文字识别里的通常做法外,还要根据数字识别的特点进行修改和补充。 对一个手写数字识别系统,可以

5、用三方面的指标表征系统的性能5: 正确识别率 A=(正确识别样本数/全部样本数)100% 替代率(误识率) S=(误识样本数/全部样本数) 100% 拒识率 R=(拒识样本数/全部样本数) 100% 三者的关系是: A+S+R=100% 数字识别的应用中,人们往往很关心的一个指标是“识别精度”,即:在所有识别的字符中,除去拒识字符,正确识别的比例有多大,定义: 识别精度P=A/ (A+S) X 100%一个理想的系统应是R, S尽量小,而P, A尽可能大。而在一个实际系统中,S,R是相互制约的,拒识率R的提高总伴随着误识率S的下降,与此同时识别率A和识别精度P的提高。因此,在评价手写数字识别系

6、统时,必须综合考虑这几个指标。另外,由于手写数字的书写风格、工整程度可以有相当大的差别,因此必须弄清一个指标在怎样的样本集合下获得的。以上多种因素使得不同系统的性能很难做绝对比较,根据从文献中所看到的和在科研研究的较高水平是:对自由书写的数字,在不拒识时达到96%以上的识别率;在拒识少于15%的样本时,误识率能降到0.1%以下。2.3基于人工神经网络的字符识别技术人工神经网络具有自学习、容错性、分类能力强和并行处理等特点5,对于手写体阿拉伯数字的识别来说,神经网络的方法是一种较有效地手段,也渐渐得到广泛的应用。用神经网络进行字符识别主要有两种方法:(1)首先对待识别字符进行特征提取,然后用所获

7、得的特征训练神经网络。这种网络的识别效果与字符特征的提取有关,而字符的特征提取往往比较耗时。(2)充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。这种网络互联较多,待处理信息量大。2.3.1预处理识别字体的过程首先是要在输入图像后进行预处理89,预处理一般包括二值化、行字切分、平滑、去噪声、规范化和细化等。不同的识别方法对预处理的要求不同。所谓的二值化(Binarization)就是指把字符灰度图像处理成二值(0, 1)图像的过程。对灰度图像二值化能显著地减小数据存储的容量,降低后续处理的复杂度。其次,在二值化后利用均值滤波的方法消除孤立点、线的噪声,这样图中

8、就只剩下手写体数字。平滑去噪后,对图像进行规范化处理。找出图像中数字的边界,然后提取出数字把它举重放置在正方形方框中,再对此正方形图像进行线性插值缩放,使它变为统一规格大小的图像。接下来,要对手写体数字进行细化。数字图像预处理前后效果比较如图1.1与图1.2,图2.1与图2.2所示10。 图1.1原始图像 图1.2预处理后图像 图2.1原始图像 图2.2预处理后图像在对字体进行预处理后要进行的是特征的提取,选取图像的灰度特征时要考虑到特征量的维数与识别的准确率的要求。例如,我们将字符归化为17像素8像素点阵图按每个像素位为0或1,形成网络的136个输入特征值,如图3所示。图3字符特征编码得到的

9、特征图像是二值图像,对应一个元素为0和l的17像素8像素的特征矩阵,然后是对特征图像编码。编码规则是,按照从左至右、从上到下的顺序,依次扫描整个特征矩阵,将每一行的0和1转换成一个136像素1像素的特征列。将每一个字符都进行编码后,顺序送送入已经训练好的神经网络识别,识别结果最后以文本格式输出。2.3.2使用BP网络的字符识别技术T.F.Pawlicki将多层BP等多种神经网络用于识别手写体数字的实验,在比较实验结果之后,证实了多层网络的分类能力要比其它几种网络好,它在一定的字符集上取得了很好的识别效果。BP神经元与其他神经元类似6,不同的是BP神经元的传输函数为非线性函数,最常用的函数是lo

10、gsig和tansig函数,有的输出层也采用线性函数(purelin)。其输出如(1)。 a = logsig(Wp+b) (1)BP神经元模型11如图4所示。图4 BP神经元的一般模型BP网络一般为多层神经网络。BP网络的信息从输入层流向输出层,因此是一种多层前馈神经网络。多层BP网络算法实现的简单流程如图5所示。图5 BP数字识别然而孙光民等人利用非线性 PCA神经网络对手写体字符进行识别的研究7,非线性PCA算法的神经网络结构如图6所示。图6非线性PCA网络将基于非线性PCA神经网络与基于BP神经网络识别的结果进行对比见表1。表1采用非线性PCA神经网络与BP神经网络对手写体数字识别结果

11、(%)类型识别率 拒识率误识率训练集 测试集训练集 测试集训练集 测试集BP网格手写体数字 97 90 1.7 6.7 1.3 3.3非线性PCA手写体数字 100 94.74 0 0 0.7 8.97由表1中的测试结果可以看出,同样对于手写体数字识别,与 BP网络识别法相比,他们提出的非线性PCA神经网络方法识别率较高,由90提高到 9474。另外,对于部分手写体样本,BP网络无法识别而被拒识,但非线性PCA网络方法拒识率为0。由此他们得出结论:基于非线性PCA神经网络信号重构模型组成的字符识别系统识别率高于传统的BP网络识别方法。2.4手写体数字识别的研究难度 数字的类别只有十种,笔划又简

12、单,其识别问题似乎不是很困难。但事实上,一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别率高,而只仅仅优于脱机手写体汉字识别。 这其中主要原因是: 第一,某些数字的相似性很大,字形相差不大,使得准确区分某些数字相当困难;第二,数字虽然只有十种,而且笔划简单,但同一数字写法千差万别,全世界各个国家各个地区的人都用,其书写上带有明显的区域特性,很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统。如图7所示为部分手写体数字。图7部分手写体数字 另外,在实际应用中,对数字识别单字识别正确率的要求要比文字要苛刻得多。这是因为,数字没有上下文关系,每个单字的识别都事关重要,而且数字识别经常涉及的财会、金融领域其严格性更是不言而喻的。因此,用户的要求不是单纯的高正确率,更重要的是极低的、千分之一甚至万分之一以下的误识率。此外,大批量数据处理对系统速度又有相当的要求,许多理论上很完美但速度过低的方法是行不通的。因此,研究高性能的手写数字识别算法是一个有相当的挑战性的任务。3总结手写体数字的识别种类虽然比汉字、字母少很多,但是由于本文提到的那些难点,且其应用领域也必将会拓展到金融、税务等以数字为主的各行业中,数字识别必将要提高到一定准确率,因此,提高单个数字的识别率,降低拒识率和误识率仍然是研究者们需要努力的方向。7

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!