基于不变距的视觉模式识别

上传人：hjk****65 文档编号：172598204 上传时间：2022-12-05 格式：DOC 页数：19 大小：452.50KB

收藏版权申诉举报下载

第1页 / 共19页

第2页 / 共19页

第3页 / 共19页

下载文档到电脑，查找使用更方便

15 积分

下载资源

资源描述：

《基于不变距的视觉模式识别》由会员分享，可在线阅读，更多相关《基于不变距的视觉模式识别（19页珍藏版）》请在装配图网上搜索。

1、基于不变距的视觉模式识别摘要：在这篇论文里二维的空间不变距将被描述为二维空间几何图形。一个涉及到不变距和著名的代数不变式论的基本的理论将被建立。完整系统的不变距将在转化，模拟，正交变换下得到。也包过一些不变距的一般二维线性变换。基于这些不变距的视觉模式识别的理论公式和实际模型两者都被讨论。一个简单的模拟程序和它的运行流程也被呈现。它表明几何图形和数字特性的识别能够被完成，在其识别的模式是独立于位置、大小与方向。它也预示着通过标识实体间的公共特征使实体间差别最小化的过程是可能包括不变性的用平行投影。I 论文简介识别的视觉模式和特征独立的位置、大小和方向在视觉领域近来已经形成大量的研究目标。为了

2、实现最大的效用和灵活性，被使用的方法应该对模型的变化是迟钝的并且为提高性能应提供重复试验的功能。在论文里提到的方法在一定程度上满足所有这些条件。到目前为止许多巧妙的设计和有趣的方法中，在这里仅仅俩种主要的类型将被提到：1）性能表的方法，2）统计的方法，包括决策论（判断理论）和随机上网成功率。当列表是被设计为一系列特殊的模型时性能表的方法会有很好的效果。在这个理论里，它是真正的位置，大小和定位独立，并且可能（考虑到）也适合其它的变化。它的功能限制是：如果一系列不同的模型被呈现给它，它将变得没有作用。还没有已知的能够自动产生一个新的性能列表的方法。另一方面，统计的方法能够带有困难的处理新的模型

3、集合，但是，它是有限的,在其识别能力的模式是独立于位置、大小与方向。这篇文章描述二维不变距的数学基础和它们在视觉信息处理方面的使用。结果说明：基于这些不变距的识别设计可能是真正的位置，大小和定位独立，并且对于学习几乎所有任何系列的模型也是相当灵活的。在经典力学和统计理论里，力矩的概念是被广泛使用的；中心力矩，大小标准化（关系正常化）和主坐标也被使用。根据作者的知识，将被提出的既是绝对也是相对的二维不变距还没有学过。在模式识别领域，为了预处理，图心和大小标准化(关系正常化)已经被开发。定位标准化（正常化）已经被尝试。在这里被提到的方法通过使用绝对的或者相对的正交不变距实现没有模糊的方向独立性。这

4、方法更深的使用力矩不变性（将被描述在III）或不变距（力矩涉及到一对独特的定点的主坐标）为每一个模式的特征的识别。第二部分，二维力矩和代数不变距的定义和内容描述。在转化，模拟,正交转化和常规的线性转化下力矩不变性在第三部分被展开。俩种特殊的使用不变距的模式识别的方法在第四部分被描述。一个简单模型的模拟程序（编程为一个LGP-30语言），这个程序的运行和一些可能的概括在第五部分被描述。 II 力矩和代数不变量 A 关于力矩的唯一定理（单值定理）在这篇文章里，二维（p+q）th 顺序的（命令的）力矩的一个密度分布公式（x，y）被定义在黎曼积分像:= p,q=0,1,2, . (I)如果假设（x，y

5、）是一个分段连续的因果有界函数，并且仅在他有穷的x，y域内有非零值；那么力矩的所有命令检查变量或公式是否已定义，接着唯一定理被证明。唯一定理：双力矩序列 m通过（x，y）被唯一确定；相反地，（x，y）通过 m被唯一确定。它应该被提到有穷假设是重要的；否则，上面的唯一定理可能不存在。1961年8月1号被信息论专业组接收。电子工程师部门，锡拉丘兹大学1. 明斯基，“人工智能的步骤，”无线电工程协会.49，pp.8-30；1961年1月。许多涉及到这些方法的能被找到在参考书目明斯基的文章。2. M-K.Hu，基于不变距的模式识别，无线电工程协会。49，P.1428；1961年9月。3. 皮兹和麦卡洛

6、克，怎么认识共性，公牛，数学，生物学杂志4. 罗伯茨，模式识别用一个适用的网络。5. 明斯基，作品号码。印证，高等教育出版社。11-12. 无线电工程协会处理关于信息论B.特征函数和力矩生成函数特征函数和力矩生成函数（x，y）可能被分别定义，如： = (2) M（u，v）=dxdy (3)在这俩种情况下，u和v被假设是真值。如果所有力矩命令存在，那么公式能被扩展成幂级数在力矩m的定义像下面： =，（4） M（u，v）= （5）这俩个公式在统计理论里被广泛使用。如果特征函数是已知函数（x，y）基本的傅里叶变换。（x，y）可能被得到从下面的傅里叶反变换：（x，y）= （6）力矩生成函数公式

7、M（u，v）在这方面不是同样的有用，但是它便于在第三部分讨论。如果我们考虑两者特殊情况下（x，y）的双边拉普拉斯变换，（7）在这s和t被当做复变量。和 M（u，v）俩者最大相似和最大不同可能被看的更加清楚。C 中心力矩中心力矩被定义为 = （8）（9）它是在已知坐标下的转换：（10）中心力矩不变；所以我们得出下面的定理：中心力矩是不变量在转化过程中。从公式（8）知，从普通力矩中确定中心力矩是相当容易的。从第一次四个命令，我们得到（11）从这开始，简单地说，所有被提到的力矩都是中心力矩，并且将被简单的表达为（12）并且力矩产生公式M（u，v）也将涉及到中心力矩。D代数表格和不变量下

8、面两个变量u和v的齐次多项式：（13）被叫做关于命令p的二元代数形式，或者简单的一个二元形式。用一种被凯利提出的表示法上面的形式可以写成：（14）系数的齐次多项式I（a）是一个重量w的代数不变量，如果（15），在这这些新的系数来自下面线性转化成原来形式（14）的取代。（16）如果w=0，不变量被叫做绝对不变量；如果它被叫做相关不变量。上面已定义的不变量可能取决于两个以上的系数。特殊的线性变换将被讨论在第三部分，不可能被限制在转化行列式中。通过消除两个相关不变量，能够得到一个非整数绝对不变量。版权所属：中国民航大学2009年11月19日从电子与电气工程师协会伊克斯托下载。使用受限。胡：视

9、觉模式识别不变量的学习，有助于提出另一对变量x和y，它的转化关系到公式（16）像下面的：（17）公式（17）的转化被提到当做同步转化，公式（16）是逆步转化。变量x，y被提到当做同步变量，u，v当做逆步变量。它们满足下面的不变量关系ux+vy= （18）代数不变量的研究一个世纪以前从凯利和西尔维斯特开始，并且被其他人强烈的追随，但是从本世纪初研究兴趣卓见减少。在第三部分讨论的力矩不变量将很大部分来自于代数不变量的结果。根据作者的知识，没有系统的研究在某种意义上对不变量描述。III.力矩不变量A. 力矩不变量的一个基本理论带有指数系数的力矩母函数扩大为数列形式为M（u，v）= （19）互换积分

10、下限并进行求和处理，我们得到M（u，v）= （20）通过使用转化公式17,19，并在转化因数（ux+vy）里用系数分别表示系数，或者同样可以用公式16和17同时表示19，我们得到（21）在这是转化公式17的雅可比行列式的绝对值，是转化后的力矩母函数。中心力距被定义为 p,q=0,1,2, （22）然后得到（23）在这个代数不变量定理里，已知一个系数在代数式14中的转化规律与单项式（24）从19,20,21和23式可以清楚的看到，同样关系式除了附加的系数外也可能包含有（）和单项式。所以，下面的基本定理被建立。力矩不变量的基本定理：如果命令p的代数形式有一个代数不变量，（25）那么命

11、令p的力矩有同样的不变量但是带有附加的因子，（26）这个定理也包含带有两个或更多不同命令形式的系数的代数不变量和带有相应命令的力矩的力矩不变量。B 相似力矩不变量在相似转化下，大小的改变，（27）任何代数形式的每个系数是一个不变量（28）a不是行列式。有力矩不变量我们得到（29）通过排除零的命令关系（30）和剩下的一个，我们得到下面绝对相似力矩不变量（31）并且。无线电工程师协会关于信息论的汇报C 正交力矩不变量在正确的正交变换或转换下：（32）我们得到J= （33）所以，力矩不变量完全与代数不变量相同。如果我们把力矩当做一个代数式 (34) 的系数，在下面的逆步变换：（35

12、）下，那么我们能得到力矩不变量通过下面的代数方法。如果我们使u，v和属于下面的转换：，（36）然后正交变换被转化成下面的简单关系，。（37）通过代入36和37到34公式，我们得到下面的恒等式：（38）在这代入以后是相对应的系数。从这U和V的恒等式，各个单项式系数在双边肯定是相同的。所以，（39）在正交变换下有（p+1）线性无关的力矩不变量，并且不是转化行列式。从38的前两个表达式的恒等式可以知道很明显（p+1）Is是的线性无关的线性方程，反之亦然。由于下面不合适的正交变换，i.e.，旋转和反射：，（41）同样地，我们得到（42）和（43）在这是同样的数和40式给的。正交不

13、变量首先被布尔研究，上面介绍的方法归功于西尔维斯特。齐次多项式运算，牛津大学出版社，1913年。胡：视觉模式识别D.一个完整的绝对正交力矩不变量系统从公式39和43，我们通过消除因子得到下面的力矩不变量系统：为二阶力矩，两个无关不变量是（44）三阶力矩，三个无关不变量是（45）第四个取决于三阶力矩（46）在公式45和46给出四个不变量它们之间存在着一个代数关系。首先（45）给的三个是绝对不变量其中两个是正常循环和一个不正常循环，但是最后公式（46）给的不变量仅仅是正常循环，在非正常循环下将改变符号。这被称作斜交不变量。所以它有助于区分镜像。一个无关绝对不变量可能从二阶和三阶力矩：（4

14、7）产生。P阶力矩，p，积分不发。不变量. （48）如果p是偶数，我们得到并且结合（p-2）阶力矩，我们得到：（50）结合二阶力矩，假设p是奇数得到（51）假设p是偶数得到（52）所以我们总是有（p+1）个无关的绝对不变量。通过改变上面的求和为求差，我们也能得到斜交不变量。所有的无关力矩不变量一起形成一个完整系统，i.e.，所有被给的不变量；总是可以通过上面的不变量的关系表达它。E.一般线性下的力矩恒等式的转化从一般线性转化下的代数恒等式理论（17），可以知道因子是转化的决定性因素。线性转化，J也是决定性因素。简单地，让A，B，C和a，b，c，d表示二阶和三阶力矩，然后我们可以写出下

15、面的这些力矩的二元形式如：（53）从这个代数恒等式定理我们得到下面四个代数无关恒等式， (54) 的权值w分别等于2,6,4和6。零阶力矩有我们得到。（55）下面四个绝对力矩恒等式也被包过。（56）也存在一个斜交恒等式，权值9取决于距A，B，C和a，b，c，d。也可以标准化为，（57）表面这个符号的决定性因素。这个齐次式包含三十个单项式，并且它不是代数无关的。通过计算各个距地关系的总和和涉及到得参数的总和，能够表面在这种情况下4是最大的无关的常量。在查找代数恒等式过程中各种方法已经被发展使用，并且很多恒等式已经被详细地证明过。万一要求扩大到更高距恒等式，有求出的代数恒等式将会用得上。I

16、V.视觉信息处理和识别A 模式区别和识别任何几何模型或代数字符总是能被密度分布公式代替，密度分布公式在视觉领域涉及一对固定坐标。显然，模式也能被它的二维距，关于一对固定坐标，代替。这样的任何阶距都能通过许多方法得到。用中心距和普通距之间的关系可以得到中心距。此外这些中心距通过使用相似距恒等式在大小上标准化，那么距恒等式集合仍旧能被用来描述特殊模式。显然，这些是无关的与模式位置和大小在视觉领域。在下面的两个部分两种不同的方法将被介绍用来完成方位无关。在这些情况下，理论上，存在无穷多个绝对距恒等式或无穷多个标准距关于主坐标。计算机识别的原因是很明显只有有限多个距能被使用。实际上，使用时仅仅一些恒等

17、式是需要的。为了证明这个观点，一个简单的仅仅用两个绝对距恒等式的模拟程序，这个程序的运行将被描述在第五部分。B 主坐标函数在（39）和（40），让p=2，我们得到下面的距恒等式：（58）如果角度是从（58）的第一个方程式判定，使，然后得到。（59）坐标轴通过满足（59）式的任何特殊的的值确定，这个坐标是主坐标轴模式。另外加限制条件，如能被唯一确定。距取自这样一对主坐标轴是与方位无关的。如果这被另外用到方程描述在最后部分，模式识别能够是与位置，大小和方位无关的。模式的识别特性将增加如果更高的距也被使用。更高距关于主坐标轴能被轻松确定，如果已给的恒等式（39）和（40）被使用。这些关系在其他

18、方法也是有用的。做一个说明，p=3得到：（60）剩下的两个关系式是这两个的复合共轭，在这省去了。如果和这四个三阶距是已知的，同样的关于主坐标轴的距通过上面的关系能被容易的计算出来。在这没有必要转换输入模式。上面的方法，由于完全与方位无关的特性，很明显数字6和9不能够被区分开如果这方程式被稍微修改如下面，它能够区分6和9当保留方位无关特性在一定限度内。的值仍旧取决于式（59），但是它也需要满足的条件。在这种情况下三阶距的使用也是关键的。如果被给的模式是圆形对称的或者是n重循环对称的，那么的通过式（59）确定是不成立的。原因是这种模式分子和分母是零。举一个例子，假设3重循环对称模式，i.

19、e.，如果模式围绕它的图心转动，它是一样的和原来的模式。在（58）的第一个方程中，仅仅有两种可能的值使虚部，i.e.，。在对称性的要求下，要有多于两个可能的值使虚部；所以，仅仅可能的是且。在三重折叠循环情况下，在（60）的第一个方程能被用来确定和主坐标轴通过条件.基于这个例子，我们声明下面的定理。定理：如果一个模式是n重折叠循环对称，比较所有的正交恒等式，带有因子整数的必须是等于0的。在这个限制条件下的圆形对称性，仅仅不是0。对于镜像对称模式，可以得到相似的定理。C绝对距恒等式方法在III-D部分讲述的绝对正交距恒等式可以直接被用来对方位无关模式进行识别如果这些恒等式和中心距相似恒等式结

20、合，那么模式识别能被制成与位置，大小和方位无关的。在V-A部分例举了一个特殊的例子。有二阶和三阶距，我们得到下面六个绝对正交恒等式：（61）和一个斜交恒等式：（62）这个斜交恒等式在识别镜像时有用。这方法能够推广到不仅完成与位置，大小和方位无关的模式识别而且能完成平行投影的。通用的一般距恒等式被用来代替正交和斜交距恒等式。V视觉模式识别模型一个简单的模式识别模型的模拟程序用书桌计算机书写仅仅使用两个距恒等式。关于将要被识别的模式没有信心特征或特性被包含在这个模拟程序中；它自己获得。视觉领域是一个16x16的小方块矩阵。一个模式首先被投射在这个矩阵上然后每个小方块被数字化为值0,2,4

21、,6或8。加载每个模式以后，下面两个距恒等式：（63）被计算。中心距（大小标准化的）上面的使用从（11）中的普通距获得。坐标点（X，Y）在二维空间被用作模式的代表。X和Y是二阶距关于主坐标轴的和和差，并且可以理解为传播距和细长度。假设程序或模型已经获得大量模式，这些模式和它们的名字一起被坐标点（）i=1,2，代表。如果一个新的模式呈现给这个模型，一个新的点（X，Y）和间距 i=1,2，（64）（X，Y）和（）被计算。定义最小距为（65）被选中的间距满足（如果多于一个间距满足条件，那么随机选择）。然后和一个预选的识别标准结合。1.）如果计算机将打印出“我不知道”，然后等着获得新的模式名字

22、。如果输入一个名字，计算机把（X，Y）存储作为带有赋值名字的（）。因此，这个程序获得一个新的模式。2.）如果（），计算机将通过输出相关名字识别带有()模式。一个简单的运行改善程序也是需要的。当程序被使用时，替换的值与他的名字一致，通过下面的式 a1 （66）这次操作移动点（）到（X，Y）。B模拟程序的运行已经在模拟程序上尝试几个实验。为了方便描述，如果一个模式能通过使用转化，循环和相似变换三步被准确的转化成另一个模式，两个模式被说成是完全的相似。在一个实验中，完全相似的模式在数字化以后送给程序。如果任何这样的模式被传授给程序仅仅一次，那么它能正确的识别任何其它的同类的模式。能够得到的不同类别模

23、式的总量是相当大的，甚至是简单的程序。没有错误的识别除了特殊的构建模式之外。另一个实验处理字符识别。一套来自硬的刻字模板的26个大写字母被复制到一个16x16矩阵上并且数字化输入到程序。X和Y的值是在表格I和图画1的任意单元，并且两个数字化输入字母M和W的采样被显示在图2.下面是需要注意的：1）图1显示所有26个字母的点被分开。2）如果使用的是模板相同但是数字化后不是完全相似的输入，对应点是不同于在图1中显示的那些的。有限的情况数量已经试过了，同样字母的两个点之间的最大间距波动大约是0.5.和图1比，很明显一些类型的覆盖将会出现。如果视觉领域的分辨率上升，性能将被确定的改善。3）在图1中

24、，可以看到一些彼此相距很近的字母在形状上有相当大的不同。一个典型的例子展现在图2中，很容易得到结论：例如字母M和W的三阶距是相当大的不同。表格1XYXYA6.20202.4986N5.78851.7933B6.11042.0853O8.28292.6246C10.41364.1818P7.03292.6456D8.20543.0911Q6.76741.9611E8.21474.3144R6.27071.9149F8.03904.5017S7.70513.3360G8.60963.0127T10.62167.1239H7.62431.1825U0.17282.1383I11.978011.284

25、8V6.87613.2715J10.41886.6854W5.66670.1893K7.32782.5620X7.57413.5651L12.06628.3889Y8.35383.8612M5.73560.0540Z8.88435.1580图1点代表26个大写字母图2数字化输入字母M和W的两个采样从这些结果清晰知道分辨率和使用恒等式的个数应该增加但是不可能非常大。一个额外的实验关于一个简单的认知程序。在这个实验中，属于同类模式的一般被不同的点代表，聚集在一起在坐标平面内。像已经描述的，一个群集代表的类型在程序中被一个单点代替，但是这个点和识别等级一起形成一个类型的循环识别区域，这个区域应该是以代表类型的点的群集为中心。在区域中心一个类型的第一个采样点是不需要的。由于这个事实，

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

基于不变距的视觉模式识别

最新文档

相关资源

相关搜索