挑战杯基于鼠标的联机手写项目结题报告

上传人:1888****888 文档编号:35933467 上传时间:2021-10-29 格式:DOC 页数:44 大小:1,014.50KB
收藏 版权申诉 举报 下载
挑战杯基于鼠标的联机手写项目结题报告_第1页
第1页 / 共44页
挑战杯基于鼠标的联机手写项目结题报告_第2页
第2页 / 共44页
挑战杯基于鼠标的联机手写项目结题报告_第3页
第3页 / 共44页
资源描述:

《挑战杯基于鼠标的联机手写项目结题报告》由会员分享,可在线阅读,更多相关《挑战杯基于鼠标的联机手写项目结题报告(44页珍藏版)》请在装配图网上搜索。

1、 挑战杯项目 宜宾学院 Y I B I N U N I V E R S I T Y “挑战杯”科技创新项目结题报告项目名称: 基于鼠标的联机汉字手写识别输入软件系统项目负责人: 院校班级: 计算机与信息工程学院12级创新班 指导老师: 时 间: 2014.11.16 简表:项目名基本情况项目名称基于鼠标的联机汉字手写识别输入软件系统类别社科论文和调查报告 自然科学论文 科技发明制作项目负责人情况姓名雷晓鸣学院/年级/专业计算机学院/12级/数字媒体专业学号121104035性别男联系电话18383118113电子邮箱570302586 项目合作者情况姓名性别学院专业学号联系电话曾帆东男计算机与

2、信息工程学院计算机科学与技术12110103718383118182何爱林男计算机与信息工程学院软件工程14060101115775973892项目简介 (1)实现了采用鼠标书写汉字的笔迹识别及存储方法。解决了脱离手写板后的汉字书写轨迹的记录技术。(2)研究分析了手写汉字的基本特点,设计了软件系统的初步功能及操作界面。如下图所示:输入汉字信息提示区汉字识别文本区菜单区手写汉字区域工具栏区图一 汉字手写识别输入系统主界面摘 要随着计算机技术特别是互联网技术日新月异的发展,人类步入了信息时代。在中国,个人计算机已进入千家万户。在计算机上使用汉字,首先遇到的问题是如何有效地输入汉字,汉字输入直接影响

3、着计算机中文信息处理的应用与发展。 在计算机上输入汉字,大都使用拼音法输入,常常不是拼不出,就是读不准,想用类似五笔法输入却往往不会拆字。针对这种情况,“手写式”输入方法变得越来越受大众欢迎。该方法完全符合人们的日常书写习惯,与平常书写汉字时一样,差别仅仅是使用者需要将输入的汉字写在“手写板”上,计算机通过捕获书写笔迹的点进行汉字识别,从而完成汉字输入。 论文论述了一种基于汉字笔划的联机手写汉字识别系统的研究与实现,在设计上通过实时捕获书写笔划的轨迹,识别出汉字的笔划,再根据笔划序列查找对应的汉字;当存在多个相似的笔划序列时再根据输入笔划的像素统计结果给出最可能的结果。在实现上不需专用的“书写

4、板”,仅用鼠标作为手写汉字输入的工具。 论文所采用的笔划识别方法是以笔划方向码的概念为基础。笔划可以细分成笔划段,本文将这些笔划段分别用8个笔划方向码来表示。在书写笔划的过程中,笔划轨迹是由一系列坐标点组成, 这些坐标点是离散的。本文用8个笔划方向码标记每1段最小直线所属的方向。每1个笔划的书写轨迹都可以产生出1个方向码序列即当前笔划的笔段序列。算法通过对方向码进行噪声处理、归并之后得到笔划的方向码序列;并通过对笔划的像素进行统计得到分区处理后的像素比例。论文设计了基于汉字笔划的联机手写汉字识别系统的工作流程。汉字识别中主要讨论了以下几个问题:(l)单一笔划的识别方法;(2)汉字笔划串的匹配;

5、(3)图像统计特征的匹配以及相关问题。 在书写工整的情况下系统识别率可达到90%左右。 关键词:联机手写汉字识别;笔划;方向码;模式识别;统计特征ABSTRACTWith the computer technology,especially the rapid development of internet technology,mankind entered the information age. In China,many families have personal computers. The use of Chinese characters in computers,the fi

6、rst encountered the problem is that how to effectively input Chinese characters. Chinese character input directly affecting the computer and information processing application development. Many Chinese keyboard input methods,mainly boil down to two categories: Pinyin input method and Codes input met

7、hod. When people input Chinese words into computer they have such worries. When using of phonetic input method,user pronunciation is not correct. When using of Codes input method,user dont know how to split the Chinese characters. In light of this situation,handwritten input method has become increa

8、singly popular. People can write entirely in accordance with their daily habits. When writing characters,users only need to input the Chinese characters in “tablet”,and computer captures the points of handwriting to accomplish Chinese characters recognition,and then complete inputting Chinese charac

9、ters. Paper discusses an online handwritten Chinese character recognition system and its implementation based on strokes. The system identifies the Chinese character strokes by real-time capturing the trajectory of strokes, and then identifies the corresponding Chinese character stroke sequence. Whe

10、n there are several similar stroke sequences, it use the pixel statistics to give the most possible results. In realization, special input tool is not needed but a mouse. The method of stroke recognition which is taken by this thesis is based on the concept of the code of stroke direction. Stroke ca

11、n be broken down into stroke sections, which are coded by eight directions. In the process of writing strokes, stroke path consist of a series of coordinate points, and these coordinates are discrete. In this paper, eight directions are used to mark the smallest section of the stroke. Each stroke is

12、 marked by a code sequence of direction. First the algorithm processes the noise of the direction, and then gives the most simple code sequence by merging the direction of strokes. And through the pixel statistics of strokes the proportion of pixels is given after partition. Thesis designs the workf

13、low of the online handwritten Chinese character recognition system based on strokes. Chinese character recognition focuses on the following issues: (l) the identification of a single stroke; (2) the matching of Chinese characters strokes sequence; (3) the matching of pixel statistics and some relate

14、d issues. Written neatly the systems identification rate can achieve around90%. Key words: On-line handwritten Chinese character recognition; Stroke; Directioncode; Stroke segment; Pattern recognition; Pixel statistics结案研究报告目录引言6编写目的6项目背景71.联机手写汉字识别概念71.1模式识别71.1.1模式识别基的本概念71.1.2模式识别的基本方法81.2联机手写识别9

15、1.2.1联机手写汉字识别基本概念91.2.2联机手写的基本方法91.2.3发展现状102可行性研究的前提112.1要求112.2目标112.3条件、假定和限制122.4需求分析123对现有系统的分析133.1处理流程133.2费用支出143.3人员143.5设备144所建议技术可行性分析144.1对系统的简要描述14配置需求144.2与现有系统比较的优越性154.3采用建议系统可能带来的影响154.3.1对设备的影响154.3.2对现有软件的影响154.3.3对用户的影响154.3.4对系统运行的影响154.3.5对开发环境的影响154.3 .6对运行环境的影响155用户使用(社会)因素可行

16、性分析166成果转化措施及社会、经济效益分析167任务概述167.1目标167.2运行环境168功能需求168.1功能划分168.2功能描述179运行需求179.1用户界面1710总体设计2110.1总体简介2110.2模块外部设计2110.3拟采取的研究方法2210.3实现难点2211. 创新点2312. 软件操作说明2313. 部分代码参考32参考文献43引言编写目的 数量浩大、结构繁杂、变化多端的汉字难以输入计算机的问题,曾一度成为我国信息化进程的瓶颈之一。作为模式识别技术的组成部分,汉字识别技术也是世界各国文字识别领域最为困难的问题。汉字识别涉及模式识别、图像处理、数字信号处理、自然语

17、言理解、人工智能、模糊数学、信息论、计算机、中文信息处理等学科,是一门综合性技术,在中文信息处理、办公室自动化、机器翻译、人工智能等高技术领域,都有着重要的实用价值和理论意义。汉字识别可以分为印刷体汉字识别和手写汉字识别两类。手写汉字识别可再分为脱机识别和联机识别两种类型。当前手写汉字识别的研究主要集中在联机识别技术这一领域。经过近十年的研究,手写汉字联机识别技术已取得了一定成果,也开发出了许多产品,电子手写笔和手写板是其典型的代表。然而,手写汉字联机识别技术在理论上也存在许多尚待解决的问题,如:任意连笔书写和较少笔顺限制的手写汉字识别技术等。因此在理论上如何解决连笔书写等识别技术难题以有效提

18、高汉字识别的准确率有待进一步研究。同时,在产品方面,当前的联机识别产品都借助于手写板这一硬件来实现,其产品成本和产品升级都需要较大代价。本项目将借助于电脑通用配置的鼠标来实现手写汉字的输入,配以项目开发的软件完成联机手写汉字的识别和输入。这一技术有着广泛的市场应用前景和较高的经济效益。主要表现为:(一)不再需要手写板这一硬件,只需电脑的通用配置鼠标即可,节约了产品成本。(二)克服了手写板损坏的成本问题。手写板在损坏以后需要一定的维修费甚至重新购买,而对于项目开发出的软件出现问题的时候,可以重新安装,不需要增加任何成本。(三)克服了产品升级的成本问题。手写板的升级一般都需要更换产品,则意味着一定

19、的硬件成本,而项目完成后的应用软件升级则不需要成本,可以通过网络直接在线升级。因此,本项目在理论研究和应用软件开发方面都用着重要意义和实用价值。项目背景联机手写字符识别的发展历史可以追溯到本世纪五十年代,伴随着手写板硬件的出现,人们开始研究联机手写字符识别技术。联机手写汉字识别技术相对起步较晚。1981年,IBM公司E.F.Yhap等推出了第一套较为成熟的联机手写汉字识别系统。该系统是基于对汉字进行笔划、字根编码的思想进行识别的。系统中每个汉字用72种字根拼成,而每个字根又可分解为42 种笔划的组合,通过对笔划和字根的判定识别所输入的汉字。1988年我国中科院刘迎建等人提出利用笔段为基元的联机

20、手写汉字识别技术。该方法把汉字分为笔段、笔划、字根、单字和词组五个层次,分别用模糊属性文法进行描述,以启发式模板引导匹配。该系统采用了对笔段进行基于位置关系的排序方法,摆脱了对笔顺的依赖。识别字典可达到6763-12000字。目前,中科院仍在进行联机手写汉字识别技术的研究与开发,其产品“汉王九九”联机手写识别系统在国内的市场占有率目前占据首位。当前,国外公司也开始注意联机手写汉字识别这一领域。IBM、Apple 等大公司均已经投资于该方向的研究。市场上也出现了许多较成熟的产品,如:蒙恬输入系统,联想1+1手写连笔王,IBM超薄手写板等。然而,绝大多数产品都采用手写板为载体。而直接单纯以软件的方

21、式实现汉字联机输入的应用软件系统几乎没有。因此,直接借助于鼠标和配套软件实现汉字输入和识别将是对目前联机汉字识别产业的有益补充,也将成为这一领域的重要发展力量,有着广阔的市场前景。1. 联机手写汉字识别概念1.1模式识别1.1.1模式识别基的本概念模式识别(Pattern Recognition)是人类的一项基本的智能,在日常的生活中工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新科学。模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析

22、,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,分为有监督的模式识别方法和无监督的识别方法两种。这两种模式识别方法的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。1.1.2模式识别的基本方法1.决策理论方法决策理论方法又称统计方法,是发展较早也比较成熟的一种方法。被识别对象首先数字化,变换为适于计算机处理的数字信息。一个模式常常要用很大的信息量来表示。许多模式识

23、别系统在数字化环节之后还进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后是进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。这时,模式可用特征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间。为此而引入鉴别函数,由特征矢量计算出相应于各类别的鉴别函数

24、值,通过鉴别函数值的比较实行分类。2.句法方法句法方法又称结构方法或语言学方法。其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述,在底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别

25、过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。模式识别方法的选择取决于问题的性质。如果被识别的对象极为复杂,而且包含丰富的结构信息,一般采用句法方法;被识别对象不很复杂或不含明显的结构信息,一般采用决策理论方法。这两种方法不能截然分开,在句法方法中,基元本身就是用决策理论方法抽取的。在应用中,将这两种方法结合起来分别施加于不同的层次,常能收到较好的效果。1.2联机手写识别1.2.1联机手写汉字识别基本概念联机手写汉字识别就是指用户一边写字,机器一边识别处理,是一种实时识别方式。识别以笔划为单位,然后根据一个汉字的笔划组合、笔划之间的相对位置和关系,

26、最终识别出汉字。联机手写汉字识别是一种良好的人机通信方式,具有简捷、自然的特点,一直是智能计算机接口的研究重点,是一种人工实时把汉字输入计算机的方法。这种方法在操作上和击键输入不同,使用者只要在专用书写板上按常规方法书写,就可以把汉字输入计算机。书写者不必学习击键的编码方案,可减轻学习一种操作方法的负担,书写方法和日常习惯基本相同。这对普及计算机应用,促进办公自动化,都很有好处。从模式识别的角度看,联机和脱机两种情况在本质上有重要区别,识别方法也有所不同。脱机手写体与印刷体汉字识别的识别对象是已经写好或印好的方块汉字,也就是说,待识别模式是一种特殊形式的二维汉字点阵图形或图像。1.2.2联机手

27、写的基本方法1.统计决策方法统计决策方法是提取待识别输入模式(例如汉字)的一组统计特征,形成该模式的多维特征向量,再依据一定的准则确定的决策函数,跟已存储在机器中的一批标准的需要识别模式(例如3755个汉字)的多维特征向量的集合匹配判别,找出其特征最接近输入模式的标准模式,该模式就被作为输入模式。例如把输入的点序列按照位置分成M*N块,每块为P*Q点阵。取每块中黑点数目为特征量xi,共有M*N个特征量xixm*n形成该字的M*N维特征向量X=(x1,x2,.,xm*n)。如果要在国标一级汉字(共3755个)范围内识别该字,需预先把3755个汉字M*N块中的黑点数目即特征量Gi求出来,i从1到3

28、755。把特征量相同的归为一类,设共有Q类(Q3755)。每一类一个模板。2.法结构方法句法结构方法汉字是一种特殊的二维图形,结构信息丰富且有规律性。所以,在统计决策方法中,如果仅把汉字看成一般的二维图形,而不利用其特殊的结构信息是很可惜的。在汉字识别中,应当充分提取汉字结构信息和组字规律。结构方法就是把被识别的模式看成是有若干较简单的子模式按一定的规律构成的集合。这些子模式又可继续按一定规律分解为更简单的子模式,直到最后分解为基元为止。基元是组成一个模式的最简单的而且是不可在分的子模式,这和一个句子由单词、短语等按语法规则组成类似。数学的一个分支形式语言学,对句子的生成做了严格的描述和规定,

29、它用句法规则检验句子是否符合某类语言的文法。我们可以借形式语言学的文法(它包含了句法规则)来描述和分析汉字结构,从而识别汉字,所以这种方法也叫句法结构方法。但是,由于汉字变形的随意性和各种干扰的存在,严格按句法结构方法识别汉字是很困难的。统计方法是以识别有噪声的文字,它可以把局部噪声和微小畸变“淹没”在多维特征值得累加和里,但是,可以用来区分结构的敏感部位的差异也随之被淹没了,所以它不能很好地利用汉字的字形结构信息;而结构法可以利用字形的结构规律来识别,对文字变体、变形适应性好,但是也正是因为它对结构特征的敏感性,导致了它的不稳定性和抗干扰能力低。1.2.3发展现状科学技术领域中对新问题的探讨

30、不少是从大学研究生的研究工作开始的,联机手写汉字识别研究似乎也是如此。1966年美国麻省理工学院研究生J.Lin的学位论文,大概是最早的关于联机手写汉字识别研究的文章之一。20世纪70年代美欧等国在这方面发表的论文较少,可能是他们习惯于用打字机打字的缘故。80年代中期以后:“个人数字助理”(PDA)袖珍型处理器问世。这种装置体积很小,可以随身携带,但无法用键盘来输入字符,笔输入方式才重新在西方受到重视。日本对联机手写汉字研究较为重视。在日本政府的支持推动下,大学和公司做了很多工作,发表了不少文章。80年代研制成若干种联机手写汉字识别系统,除英文字母、日本假名、数码和标点符号外,能识别的汉字字数

31、约有20003000个。1992年夏普公司推出笔输入电子笔记本,可识别5000多个汉字,识别率达95,使用者可按常规笔顺书写,但对连笔限制较严。该产品代表了日本当时联机手写汉字识别技术的最高水平。我国关于汉字识别技术研究开展较晚。80年代初个人计算机才在国内逐步得到应用。一些大学和研究机构认识到汉字输入的重要性,积极开展有关研究。1983年中文信息学会第二届全国学术会议在武汉召开,哈工大、江西冶金工程学院、上海仪器仪表研究所等单位在大会宣读了有关联机手写汉字识别的论文,开我国汉字识别研究的先河。1984年11月在北京举办的高科技成果展览会上,哈工大和总参61所联合展出了联机手写汉字识别实验系统

32、,引起了与会学者的高度重视,大大促进了这方面的研制工作。此后哈工大、总参通信部、清华大学与西安交大等单位均有研究成果通过鉴定,但大都属于实验系统,识别汉字字数采用我国国标GB2312-80基本字符集所规定的两级汉字,即3755个或6763个,大大超过当时日本研制的系基本字符集所规定的两级汉字,即3755个或6763个,大大超过当时日本研制的系部与中科院自动化研究所联合研制成功的联机手写汉字识别系统,以“汉王笔”为名正式投入市场,识别字数为676312000字。用户初次使用时识别率约为80,经常使用后可达到95,对笔顺要求也不严格,部分字连笔书写时也能正确识别。当时计算机速度尚不太高的情况下,识

33、别速度基本上能跟上书写速度。这种产品当时不但在我国内地和香港销售,还销往台湾地区,以至新加坡等国。我国实行改革开放政策以来,国家对汉字识别研究十分重视,先后把它列入国家“七五”、“八五”等重点攻关项目和“863”高科技研究计划中,大大促进我国有关研究工作的发展。90年代以来,若干种联机手写汉字识别系统,如上述中自公司的汉王笔,以及后来的北大方正的如意笔、清华文通公司的文通笔和哈工大的万通笔等纷纷投入市场,取得了很好的社会效益和经济效益。近几年来,台湾的“蒙恬笔”、美国摩托罗拉的“慧笔”等笔输入装置,也先后进入我国市场。尤其是摩托罗拉公司仗其雄厚资本,开展巨大宣传攻势,企图抢占我国笔输入的市场,

34、对我国有关企业增加了不小压力。值得我们引以为荣的是:在1995年12月和1998年4月前后两次由我国“863计划智能组主题专家组”组织的实测评比中(这种评比由863专家组主持,每两年举办一次),清华文通笔和中自公司的汉王笔的性能都居于领先地位;对329309个汉字测试的综合结果,我们自公司的汉王笔的性能都居于领先地位;对329309个汉字测试的综合结果,我们刚揭开,我国研制的系统目前已有的优势不大,而境外公司,包括台湾地区的有关单位,却已大张旗鼓,投入更大的人力物力,在研究和宣传方面和我们竞争。他们除了在改进笔输入系统性能方面下功夫之外,还配合语音输入,进一步改善人机接口的功能,抢占我国市场更

35、大的份额。我国宋代诗人杨万里诗云:“莫言下岭便无难,赚得行人错喜欢。正人万山圈子里,一山放出一山拦。”今后将困难重重,任重而道远。我们必须做更艰苦的工作,才能保持我们在汉字识别方面研究工作的优势。值得注意的是,国外一些大公司也开始注意联机手写汉字识别这一领域。Motorola,Microsoft,Apple等大公司均已经投资于该方向的研究。由于资金雄厚,并且具有很强的软、硬件优势,其势头不可小视。国内研究人员应该奋起努力,把这一具有浓厚文化特色的研究课题的主流掌握在中国人自己手中。2可行性研究的前提2.1要求a. 功能:实现鼠标写字识别的功能。b. 与软件相关的其他系统:Delphi7 及Wi

36、ndows系统c. 完成期限:2014.11.102.2目标a. 笔顺的识别及处理技术。目前手写汉字的笔顺还没有一个正式的国家标准,对某些汉字,不同人的笔顺习惯不完全相同,因此,项目将研究手写汉字识别中笔顺的识别及处理技术。b. 连笔识别技术。项目将进一步研究连笔汉字的识别技术,以提高手写汉字的识别效率。c. 手写汉字的代码表征算法。项目将研究有效的手写汉字代码表示技术,以提高汉字的区分度,提高识别效率。d. 应用软件系统的开发。项目将重点开发出具有实际应用价值的软件系统。2.3条件、假定和限制a. 进行系统方案选择比较的期限:2013.4.232014.5.10b. 经费来源和使用限制:无c

37、. 法律和政策方面的限制:无d. 硬件、软件、运行环境和开发环境的条件和限制:基于Delphi7和Window系统e. 可利用的信息和资源:网络2.4需求分析1. 任务概述 (1)目标:在中国,个人计算机已进入千家万户。在计算机上使用汉字,首先遇到的问题是如何有效地输入汉字,汉字输入直接影响着计算机中文信息处理的应用与发展。在计算机上输入汉字,大都使用拼音法输入,常常不是拼不出,就是读不准,想用类似五笔法输入却往往不会拆字。针对这种情况,“手写式”输入方法变得越来越受大众欢迎。该方法完全符合人们的日常书写习惯,与平常书写汉字时一样,差别仅仅是使用者需要将输入的汉字写在“手写板”上,计算机通过捕

38、获书写笔迹的点进行汉字识别,进而完成汉字输入。(2)用户特点:本软件最终的适用对象是普通的老百姓,那么就要求操作起来要简洁化、方便化、人性化。只要是会书写汉字的用户就有能力使用该软件,由于不同的用户其书写习惯不尽相同,因此,此软件要具有很好的适应性,即提供学习功能。(3)本系统适合于要求不太复杂的用户进行手写输入的汉字识别,如果对数据的存储进行优化,再加上高效的输入设备,这将会成为一款经济实惠的手写识别输入系统。2.需求规定(1)功能需求根据系统的功能要求,本文中的联机手写汉字识别系统可分为以下功能模块:笔迹采集、用户数据预处理、特征提取编码、学习、识别等。图2-4系统功能层次方框图描述的系统

39、功能的层次关系。(2)性能需求时间特性:输入的汉字没有时间的要求特性。 图2-43对现有系统的分析3.1处理流程界面和菜单结构整体流程:整体实现详细设计调试改进提交完成想法可行性说明时间计划安排概要设计3.2费用支出需要一间足够二个人同时办公的空间,以及书籍等材料。3.3人员熟悉Delphi7软件的程序员,熟悉C.C#等软件的程序员,熟悉数据库使用的人员,熟悉文档规范的文案员。3.5设备安装有Windows 2000及以上系统带有Delphi7软件的电脑两台。4所建议技术可行性分析4.1对系统的简要描述配置需求 配置项最低配置推荐配置CPUIntel 赛扬 Celeron 1 GhzIntel

40、 酷睿i7 3.3Ghz以上内存64M8GB或以上硬盘10M以上剩余空间1GB以上剩余空间显卡GeForce MX400GeForce GTX 590或更好网络无无操作系统Windows 2000,XP,7Windows 7 Ultimate驱动程序Direct X 9.0cDirect X 11.04.2与现有系统比较的优越性与现有系统比较,该软件具有体积小、运行速度快、即开即用、界面友好、简单易操作、老少皆宜的优点。4.3采用建议系统可能带来的影响4.3.1对设备的影响无4.3.2对现有软件的影响无4.3.3对用户的影响适合不会使用打字的中老年人使用。4.3.4对系统运行的影响无4.3.5

41、对开发环境的影响无4.3 .6对运行环境的影响仅占用少了的内存和CPU。5用户使用(社会)因素可行性分析此款软件老少皆宜,主要面向的老人(使用电脑却不会打字的用户),容易上手。同时该软件体积小,兼容性强,对硬件要求不高可以在很多电子产品上运行,满足更广大群众的消遣娱乐需求。6成果转化措施及社会、经济效益分析本项目的完成一方面可以为当前的汉字识别技术提供理论方法;另一方面开发的联机手写汉字识别及输入系统软件可直接在电脑上安装应用,有着广泛的市场及应用前景,有较高的经济效益。以当前学院有1千台电脑为基数,一个普通手写笔的售价约为40元,则为每一台都安装手写输入系统共需4万元,而本项目完成后的软件则

42、仅需刻录安装光盘的费用,约为3元/张,且不再需要投入维修及升级产品的购买等费用,经济效益明显。7任务概述7.1目标完成鼠标联机手写设计,并且调试运行成功。7.2运行环境操作系统:window7支持环境:window98及以上操作系统。8功能需求8.1功能划分实现基本的手写功能,并且有输入字的功能,以及利于初学者学习的帮助功能。8.2功能描述1.界面简单,明了。2.拥有鼠标写字,识字的功能。3.可以存储汉字的数据库。4.拥有存储汉字的基本属性。9运行需求9.1用户界面9.1-软件主窗口9.2-手写输入窗口 识别出来的汉字9.2-手写输入框9.3-手写输入框表栏9.4-汉字输入窗口识别汉字属性9.

43、5-汉字输入框情况9.6-数据库的管理窗口9.7-数据库菜单栏10总体设计10.1总体简介在中国,个人计算机已进入千家万户。在计算机上使用汉字,首先遇到的问题是如何有效地输入汉字,汉字输入直接影响着计算机中文信息处理的应用与发展。在计算机上输入汉字,大都使用拼音法输入,常常不是拼不出,就是读不准,想用类似五笔法输入却往往不会拆字。针对这种情况,“手写式”输入方法变得越来越受大众欢迎。该方法完全符合人们的日常书写习惯,与平常书写汉字时一样,差别仅仅是使用者需要将输入的汉字写在“手写板”上,计算机通过捕获书写笔迹的点进行汉字识别,进而完成汉字输入。本文实现的就是这样一种手写识别输入系统。论文论述了

44、一种基于汉字笔划的联机手写汉字识别系统的研究与实现,在设计上通过实时捕获书写笔划的轨迹,识别出汉字的笔划,再根据笔划序列查找对应的汉字;当存在多个相似的笔划序列时再根据输入笔划的像素统计结果给出最可能的结果。在实现上不需专用的“书写板”,仅用鼠标作为手写汉字输入的工具。主菜单10.2模块外部设计退 出 汉 字 输 入数据库管理汉 字 训 练10.3拟采取的研究方法本项目主要包括手写汉字识别技术的若干理论问题研究以及手写汉字识别输入系统的软件开发。研究的内容结构及流程如下:研究借助鼠标实现记录汉字书法轨迹的方法研究手写汉字笔画代码的表征算法研究连笔字以及“倒画笔”汉字的识别技术开发手写汉字识别输

45、入软件系统在手写汉字识别技术理论上主要研究手写汉字的代码表征算法以及连笔字和“倒画笔”汉字的识别技术。拟借助于人工神经网络技术、结构模型匹配法、识别可信度表征技术、级联HMM方法、笔段序列匹配法等实现联机汉字的识别。在软件系统开发上将采有delphi6.0 作为开发工具,借助delphi 6.0所提供的强大数据库功能和良好的图形图像技术来实现软件的研发。图10.210.3实现难点一:本项目理论研究存在的难点:(1)手写汉字的代码表征算法。解决方案:考虑从手写汉字的笔段、笔划、字根、起笔坐标、落笔坐标等属性入手,采用结构模型匹配法、识别可信度表征技术、 级联HMM方法、笔段序列匹配法等实现手写汉

46、字的代码的表征。(2)连笔及“倒画笔”的汉字识别技术。 解决方案:考虑对汉字进行笔划、字根编码的方法实现其识别技术。主要借助于人工神经网络技术、模式识别技术、常用的图形处理技术等对笔划和字根进行判定识别,实现连笔及“倒画笔”的汉字识别。二:软件系统设计方面需要解决的问题:(1)汉字特征库的建立。拟采取计算机自动训练及机器学习等方法完成汉字特征库的建立。(2)软件研发的实现。将以软件工程的理论作指导,运用前期研究的理论方法开发联机汉字的识别输入系统。11. 创新点本项目主要完成手写汉字识别技术的若干理论问题研究以及手写汉字识别输入系统的软件开发,其特色与创新之处是:(1)提出手写汉字的代码表征算

47、法,以有效的代码表征输入汉字,提高识别准确率。(2)提出连笔字和“倒画笔”汉字的识别技术,提高汉字识别算法的有效性,扩大联机汉字识别技术的应用领域。(3)开发联机手写汉字识别输入系统软件。这将是对目前联机汉字识别产品的有益补充,有着广阔的市场前景12. 软件操作说明1.运行环境:win7 64位操作系统+Delphi 7编译环境。(没有Delphi 7编译环境将不能正常运行)2. 注意事项:(1)将软件放在D盘目录下打开(如图)图12.1(2)打开指定exe文件图12.23. 功能介绍及说明:(1) 进入主界面图12.3(2)进入主界面图12.4(3)进入汉字输入界面单机进入图12.5(4)汉

48、字输入界面汉字写错可以进行重写,如果数据库没有这个字可以将这个字录入数据库图12.6(5)手写输入区在这里输入汉字图12.7(6)汉字识别区(手写汉字后会识别相应的汉字出来)汉字识别区域图12.8(7)汉字识别的多项性有时会识别出多种汉字供给选择图12.8(8)进入汉字输入区进入汉字训练区图12.9(9)汉字输入区主界面图12.10(10)汉字输入框可以在上面录入你想存储的汉字图12.11(12)汉字输入框对应的属性对应的汉字和汉字的笔画数图12.12可以将汉字的样式存入数据库也可以重新训练图12.13(13)进入数据库界面进入数据库页面图12.14(13)进入数据库界面图12.15添加删除数

49、据库中的汉字图12.16(14)退出系统图12.1713. 部分代码参考图13.1begin / write:=true; speedbutton1.Enabled :=true; speedbutton3.Enabled :=true; / xstart:=x; ystart:=y; wmax:=x; hmax:=y; wmin:=x; hmin:=y; bihua:=bihua+1;end;procedure TForm3.Image1MouseUp(Sender: TObject; Button: TMouseButton; Shift: TShiftState; X, Y: Integ

50、er);begin / write:=false; xend:=x; yend:=y; /点笔画 if (abs(xstart-xend)30) and (abs(ystart-yend)30) then edit4.Text:=edit4.Text+ 0 / 竖笔画 else if (abs(xstart-xend)50) and (abs(wmax-wmin)30) then edit4.Text:=edit4.Text+ 2 / 横笔画 else if (abs(ystart-yend)50) and (abs(hmax-hmin)xend) and (ystart40) and (ab

51、s(ystart-yend)50) and (abs(wmin-xend)25) and (abs(xminy-yend)25)then edit4.Text:=edit4.Text+ 3 / 捺笔画 else if (xstartxend) and (ystart40) and (abs(ystart-yend)50) and (abs(xmaxy-yend)25) and (abs(ymaxx-xend)50) and (abs(xmaxy-yend)50) then edit4.Text:=edit4.Text+ 5 / 逆折笔画 else if (abs(ystart-yend)50)

52、 and (abs(xminy-yend)50)then edit4.Text:=edit4.Text+ 6 else edit4.Text:=edit4.Text+ 7; / if bihua=1 then begin /点笔画 if (abs(xstart-xend)30) and (abs(ystart-yend)30) then edit1.Text:=edit1.Text+ 0 / 竖笔画 else if (abs(xstart-xend)50) and (abs(wmax-wmin)30) then edit1.Text:=edit1.Text+ 2 / 横笔画 else if (

53、abs(ystart-yend)50) and (abs(hmax-hmin)xend) and (ystart40) and (abs(ystart-yend)50) and (abs(wmin-xend)25) and (abs(xminy-yend)25)then edit1.Text:=edit1.Text+ 3 / 捺笔画 else if (xstartxend) and (ystart40) and (abs(ystart-yend)50) and (abs(xmaxy-yend)25) and (abs(ymaxx-xend)50) and (abs(xmaxy-yend)50)

54、 then edit1.Text:=edit1.Text+ 5 / 逆折笔画 else if (abs(ystart-yend)50) and (abs(xminy-yend)50)then edit1.Text:=edit1.Text+ 6 else edit1.Text:=edit1.Text+ 7; end; / / if bihua=2 then begin /点笔画 if (abs(xstart-xend)30) and (abs(ystart-yend)30) then edit2.Text:=edit2.Text+ 0 / 竖笔画 else if (abs(xstart-xend

55、)50) and (abs(wmax-wmin)30) then edit2.Text:=edit2.Text+ 2 / 横笔画 else if (abs(ystart-yend)50) and (abs(hmax-hmin)xend) and (ystart40) and (abs(ystart-yend)50) and (abs(wmin-xend)25) and (abs(xminy-yend)25)then edit2.Text:=edit2.Text+ 3 / 捺笔画 else if (xstartxend) and (ystart40) and (abs(ystart-yend)5

56、0) and (abs(xmaxy-yend)25) and (abs(ymaxx-xend)50) and (abs(xmaxy-yend)50) then edit2.Text:=edit2.Text+ 5 / 逆折笔画 else if (abs(ystart-yend)50) and (abs(xminy-yend)50)then edit2.Text:=edit2.Text+ 6 else edit2.Text:=edit2.Text+ 7; end; / /end;procedure TForm3.Image1MouseMove(Sender: TObject; Shift: TShiftState; X, Y: Integer);begin/ if write then begin / /image2.Canvas.pixelsx,y:=rgb(122,r,r); image1.Canvas.pixelsx,y:=clred; image1.Canvas.pixelsx-1,y:=clred; image1.Canvas.pixelsx,y-1:=clred; image1.Canvas.pixelsx+1,y:=clred; image1.Canvas.pixelsx,y+1:=clred; image1

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!