模式识别知识重点

上传人:d**** 文档编号:209209620 上传时间:2023-05-12 格式:DOCX 页数:5 大小:17.48KB
收藏 版权申诉 举报 下载
模式识别知识重点_第1页
第1页 / 共5页
模式识别知识重点_第2页
第2页 / 共5页
模式识别知识重点_第3页
第3页 / 共5页
资源描述:

《模式识别知识重点》由会员分享,可在线阅读,更多相关《模式识别知识重点(5页珍藏版)》请在装配图网上搜索。

1、1、你如何理解“人工智能”以及“智能”? 参考答案:人工智能是通过研制智能机器或者编制程序模拟人或者高级生物的智 能行为。智能的行为具有如下特征:感知能力、记忆与思维能力、学习与自适应 能力、行为能力等,这些来自于人脑的活动结果。2、什么是不确定推理?不确定的因素有哪些?是什么原因造成的? 参考答案:从不确定的初始证据出发,通过运用不确定性的知识,最终推出具有 一定不确定性但是合理的或者近乎合理的思维过程。不确定的因素有:证据不确 定(存在错误、准确性无法判定)、匹配不确定、知识(规则)不确定、合成规 则不确定等。造成不确定的原因有:主观的和客观的,例如概率的、模糊的、信 息不完备、准确性无法

2、验证等,本质上是由于人的认识的有限性。 需要解决的基本问题有:不确定性的表示和量度,不确定性匹配算法以及阈值的 选择,组合证据不确定性算法,不确定性的传递算法,结论不确定性的合成等。3、你如何理解特征空间?表示样本有哪些常见方法? 参考答案:由利用某些特征描述的所有样本组成的集合称为特征空间或者样本空 间,特征空间的维数是描述样本的特征数量。描述样本的常见方法:矢量、矩阵、 列表等。4、贝叶斯决策理论中,参数估计和非参数估计有什么区别? 参考答案:参数估计就是已知样本分布的概型,通过训练样本确定概型中的一些 参数;非参数估计就是未知样本分布概型,利用 Parzen 窗等方法确定样本的概 率密度

3、分布规律。5、线性和非线性分类器与基于贝叶斯决策理论的分类器之间是什么关系? 参考答案:线性分类器与非线性分类器都属于几何分类器,是统计模式识别的一 种;基于贝叶斯决策理论的分类器属于概率分类,主要是基于样本在特征空间的 概率分布;利用未知样本属于已知类别的概率或者风险大小进行分类。几何分类 的理论基础是概率分类,是一种简单的处理方式,不需要求解样本的概率分布, 只需要利用已知样本训练得到一些几何分界面即可。6、无教师示范的非监督学习与聚类分析之间有何联系?有哪些常见的非监督学 习方法?试简要介绍其中一种方法,并给出必要的公式。参考答案:无教师示范的学习或者训练就是非监督学习,表现在算法上主要

4、是聚 类分析。聚类分析算法有最大最小距离方法、C均值等。最大最小距离算法的基 本思想是:1)首先任选一个样本作为第一个聚类类心;2)从其他样本中找到一个距离最远的样本作为另一个类心;3)计算未被作为类心的各样本到这两个类心的距离,其各自最小的距离;4)从这些最小的距离中找到一个最大的样本作为第三个类心;5)重复上述过程一直到不需要设立新的类心;6)最后按照最小距离准则进行聚类。7、知识是人们在长期的生活及社会实践中积累起来的对客观世界的认识与经验, 人们把实践中获得的信息关联在一起,就获得了知识。 知识反映了客观世界中 事物间的关系,不同事物或者相同事物间的不同关系形成了不同的知识。 知识的特

5、性:相对正确性、不确定性(随机性引起的不确定性、模糊性引起的、 不完全性引起的、经验引起的)、可表示性与可利用性 分类:范围分:常识性知识,领域性知识;作用及表示分:事实性知识,过程性 知识,控制性知识;确定性来分:确定性知识,不确定;知识结构及表现形式: 逻辑性知识,形象性知识;抽象、整体的来分:零级知识,一级知识,二级知识 8 知识表示:所谓知识的表示实际上是对知识的一种描述,或者说一种约定,一 种计算机可以接受的用于描述知识的数据结构。对知识的表示过程就是把知识编 码成某种数据结构的过程分类: 符号表示法、连接机制表示法 知识表示方法:一阶谓词逻辑表示法、产生式规则表示法、框架表示法、语

6、义网 络表示法、脚本表示法、petri网表示法、面向对象表示法9. 产生式:含义是如果前提 P 所指示的条件被满足时,则可得出结论 Q 或者执行 Q 所规定的操作。谓词逻辑中的蕴含式与产生式有相同的基本形式,蕴含式是产 生式的一种特殊情况(蕴含式表示精确知识,产生式可表示不精确知识;精确匹 配,产生式可是不精确匹配) 规则库:用于描述相应领域中的知识的产生式集合。规则库、综合数据库、控制 系统(If该动物会飞and会下蛋then该动物是鸟) 产生式问题的求解步骤 1 初始化综合数据库,把问题的初始已知事实送入综合数 据库中 2 若规则库中存在尚未使用过的规则,而且它的前提可与综合数据库中的 已

7、知事实匹配,则转第3 步;若不存在这样的事实,则转第5 步。3 执行当前选 中的规则,并对规则作上标记,把该规则执行后得到的结论送入综合数据库中。 如果该规则的结论部分指出的是某些操作,则执行这些操作。4 检查综合数据库 中是否已包含了问题的解,若已包含,则终止问题的求解过程,否则转第 2 步。 5 要求用户提供进一步的关于问题的已知事实,若能提供,则转第2 步,否则终 止问题的求解过程。6 若规则库中不再有未使用的规则,则终止问题的求解过程。 产生式系统为三类:可交换的产生式系统;可分解的;可恢复的 产生式表示法优点:1.自然性 2.模块性 3.有效性 4.清晰性。不足:1.效率不高 2.

8、不能表达具有结构性的知识10. 框架:是用于描述具有固定的静态对象的通用数据结构,实质上是一个层次 的嵌套链接表,是一种集事物各方面属性的描述为一体,并反映相关事物间各种 关系的数据结构。一框架若干槽,一槽若干侧面,属性值称槽值和侧面值;一侧 面有一或多侧面值。框架名作为槽值的框架是横向关系,继承槽建立的框架是纵 向关系,有横纵向的为双向。11. 推理:从已知事实出发,通过运用已掌握的知识,找出其中蕴含的事实,或 归结出新的事实,这一过程称为推理。分类:从新判断推出的途径分,演绎推理、 归结推理、默认推理;所用知识的确定性分:确定性推理,不确定性。是否单调: 单调推理、非单调推理;启发分:启发

9、式推理、非启发式推理;方法论分:知识 的推理、统计推理、直觉推理 不确定性推理指推理时所用的知识不都是精确的,推出的结论也不完全是肯定 的,其真值位于“真”和“假”之间,命题的外延模糊不清。正向推理是以已知事实作为出发点的一种推理,又称数据驱动推理、前向链推理 及前件推理等。思想:从用户提供的初始已知事实出发,在知识库KB中找出当 前可适用的知识,构成可适用知识集KS,然后按某种冲突消解策略从KS中选 出一条知识进行推理,并将推出的新事实加入到数据库中作为下一步推理的已知 事实,在此之后再在知识库中选取可适用的知识进行推理,如此重复,直到求得 了所要求的解,或者知识库中再无可适用的知识为止。

10、逆向推理是以某个假设 目标作为出发点的一种推理,又称为目标驱动推理、逆向链推理及后件推理等。 思想:首先选定一个假设目标,然后寻找支持该假设的证据,若所需的证据都能 找到,则说明原假设成立;若无论如何都找不到所需证据,说明原假设不成立, 此时需要另作新的假设。优:不必使用与目标无关的知识,目的性强,同时还有 利于向用户提供解释。缺:初始目标的选择有盲目性,若不符合实际,就要多次 提出假设,影响到系统效率。 双向推理是指正向推理与逆向推理同时进行,且 在推理过程中的某一步骤上“碰头”的一种推理方式。思想:一方面根据已知事实 进行正向推理,但并不推到最终目标;另一方面从某假设目标出发进行逆向推理,

11、 但并不推至原始事实,而是让它们在中途相遇,即由正向推理所得的中间结论恰 好是逆向推理此时所需要的证据,这时推理就可结束,逆向推理时所做的假设就 是推理的最终结论。12. 不确定性推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识 的运用和处理,是从不确定性的初始证据出发,通过运用不确定性的知识,最终 推出具有一定程度的不确定性但却合理或者近乎合理的结论的思维过程。表示与 量度分为:知识不确定性、证据不确定性 专家系统中,知识的不确定性一般由领域专家给出,通常是一个数值,它表示相 应知识的不确定性程度,称为知识的静态强度;证据的不确定性通常也用一个数 值表示,它代表相应证据的不确定性程

12、度,称为动态强度 确定量度及范围注意几点:量度能充分表达相应知识及证据不确定性的程度;量 度范围的指定应便于领域专家及用户对不确定性的估计的程度;量度要便于对不 确定性的传递进行计算,而且对结论算出的不确定性量度不能超出量度规定的范 围;量度的确定应是直观的推理方法分两类: 1. 在推理一级上扩展确定性推理:把不确定的证据和不确定 的知识分别与某种量度标准对应起来,并且给出更新结论不确定性的算法,从而 构成了相应的不确定性推理的模型,它与控制策略无关,无论用何种控制策略, 推理的结果是唯一的,称为模型方法。2.控制策略一级处理不确定性:特点:通 过识别领域中引起不确定的某些特征及相应的控制策略

13、来限制或减少不确定性 对系统产生的影响,它没有处理不确定性的统一模型,其效果极大的依赖于控制 策略,称为控制方法。模型方法分数值方法和非数值;数值分基于概率的方法(依据概率论的有关理论 发展起来的方法,主要有主观Bayes、可信度、证据理论等方法)和模糊推理(根 据模糊理论发展起来的方法);非数值是除数值方法之外的方法,如发生率计算, 它采用集合来描述和处理不确定性。13. 可信度方法在确定性理论的基础上,结合概率提出的一种不确定性推理方法, 首先在Mycin系统中得到了成功的应用。思想是:利用确定性因子CF(值)联 系于具体的断言;联系于每条规则;通过CF的计算传播不确定性。14. 搜索:人

14、工智能所要解决的大部分问题是结构不良或非结构化的问题,对这 样的问题一般不存在成熟的求解算法可供利用,而只能是利用已有的知识一步步 摸索着前进。在此过程中,存在着如何寻找可用知识的问题,即如何确定推理路 线,使其付出的代价尽可能的少,而问题又能得到较好的解决。像这样根据问题 的实际情况不断寻找可利用的知识,从而构造一条代价较少的推理路线,使问题 得到圆满解决的过程称为搜索。分类:盲目搜索和启发式搜索。盲目搜索:按预 定的控制策略进行搜索,在搜索过程中获得的中间信息不用来改进控制策略。这 种搜索具有盲目性,效率不高,不便于复杂问题的求解。启发式搜索:在搜索中 加入了与问题有关的启发性信息,用以指

15、导搜索朝着最有希望的方向前进,加速 问题的求解过程并找到最优解。求解问题表示法:状态空间表示法和与 /或树表示法;状态空间表示法是用来表 示问题及其搜索过程的一种方法,它是人工智能中最基本的形式化方法。状态空 间表示法是用“状态”和“算符”来表示问题的一种方法。与/或树是用于表示问题及 其求解过程的又一种形式化方法,通常用于表示比较复杂问题的求解。对于一个 复杂问题,直接求解往往比较困难。此时,可通过下述方法进行简化:分解(“与” 树:把一个复杂问题分解为若干个较为简单的子问题,然后对每个子问题分别进 行求解,最后把各子问题的解复合起来就得到了原问题的解。)和等价变换(“或” 树利用等价变换,

16、把它变换为若干个较容易求解的新问题。若新问题中有一个可 求解,则就得到了原问题的解)15. 搜索策略:广度优先搜索、深度优先搜索、有界深度优先搜索、 代价树的广 度优先搜索、代价树的深度优先搜索(以上属于盲目搜索策略)、局部择优搜索、 全局择优搜索(以上搜索属于启发式搜索)。16. 广度优先思想:从初始节点开始,按照某种生成规则(算符)逐步生成下一 级各子节点,顺序(先生成的子节点优先检查,优先扩展)地检查是否出现目标 节点,在该级全部节点中沿广度进行“横向”扫描,即:沿“广度”遍历所有节点, 故称“广度优先搜索法”。搜索过程:1把初始节点SO放人OPEN表,若SO为目 标节点,则得到问题的解

17、,退出;2 如果 OPEN 表为空,则问题无解,退出;3 把OPEN表的第一个节点(记为节点n)取出放入CLOSED表;4.考察节点n若 节点n不可扩展,则转第II步;5扩展节点n,将其子节点放入OPEN表的尾部, 并为每一个子节点都配置指向父节点的指针;6如果n的任一个后继节点是目标 节点,则找到问题的解,成功退出,否则转向第II步。缺点:广度优先搜索的 盲目性较大,当目标节点距离初始节点较远时将会产生许多无用节点,搜索效率 低,这是它的缺点。优点: 只要问题有解,用广度优先搜索总可以得到解,而 且得到的是路径最短的解,这是它的优点。17. 深度优先思想:从初始节点SO开始,按生成规则生成下

18、一级各子节点,若目 标节点未出现,则按“最晚生成的子节点优先扩展”的原则,生成再下一级的子节 点,如此下去,沿着最晚生成的子节点分支,逐级向“纵向”深入发展,故称为“深 度优先搜索法”。搜索过程:广度优先搜索是将节点n的子节点放入到OPEN表 的尾部,而深度优先搜索是把节点 n 的子节点放入到 OPEN 表的首部。仅此一 点不同,就使得搜索的路线完全不一样。总结:在深度优先搜索中,搜索一旦 进 入某个分支,就将沿着该分支一直向下搜索。如果目标节点恰好在此分支上,则 可较快地得到解。但是,如果目标节点不在此分支上,而该分支又是一个无穷分 支,则就不可能得到解。所以深度优先搜索是不完备的,即使问题

19、有解,它也不 一定能求得解。另外,用深度优先搜索求得的解,不一定是路径最短的解,其道 理是显然的。18. 有界深度优先思想:为了解决深度优先搜索不完备的问题,避免搜索过程陷 入无穷分支的死循环,对深度优先搜索引入搜索深度的界限(设为dm),当搜 索深度达到了深度界限,而尚未出现目标节点时,就换一个分支进行搜索。代价 树的广度优先思想是:每次从OPEN表中选择节点往CLOSED表传送时,总是 选择其代价为最小的节点。也就是说,OPEN表中的节点在任一时刻都是按其代 价从小至大排序的,代价小的节点排在前面,代价大的节点排在后面,而不管节 点在代价树中处于什么位置。代价树的深度优先思想:在代价树的广

20、度优先搜索 中,每次都是从 OPEN 表的全体节点中选择一个代价最小的节点送入 CLOSED 表进行考察;代价树的深度优先搜索是从刚扩展出的子节点中选一个代价最小的 节点送入 CLOSED 表进行考察。19. 启发式搜索要用到问题自身的某些特性情息,以指导搜索朝着最有希望的方 向前进。由于这种搜索针对性较强,因而原则上只需要搜索问题的部分状态空间, 效率较高局部择优搜索是一种启发式搜索方法,是对深度优先搜索方法的一种改进。思想: 当一个节点被扩展以后,按f(x)对每一个子节点计算估价值,并选择最小者作为 下一个要考察的节点,由于它每次都只是在子节点的范围内选择下一下要考察的 节点,范围比较狭窄

21、,所以称为局部择优搜索。全局择优搜索思想是从刚生成的 子点节中选择一个节点进行考察,选择的范围比较狭窄;每次从 OPEN 表的全 体节点中选择一个估价值最小的节点进行考察。只此一点与局部择优搜索不同。20. 专家系统:一个智能计算机系统,其内部含有大量的某个领域专家水平的知 识和经验,能够以人类专家的水平(知识和解决问题的方法)完成特别困难的某 一专业领域的任务。简言之,专家系统是一种模拟人类专家解决领域问题的计算 机程序系统。细言之,专家系统是一个具有大量的专门知识和经验的程序系统, 它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的的知识和 经验,进行推理和判断,模拟人类专家的

22、决策过程,以便解决那些人类专家处理 的复杂问题。21. 什么是模式?人们通常是如何表示模式的? 对分类识别的对象进行科学的抽象,建立它的数学模型,用以描述和代替识别对 象,称这种对象的描述为模式。从它的定义可看出,模式是通过数学模型来表示 的。22. 什么是聚类分析?聚类分析是有监督分类还是无监督分类?为什么? 聚类分析是基于数据集客观存在着若干个自然类、每个自然类中的数据某些属性 都具有较强的相似性而建立的一种数据描述方法。是无监督的分类。因为在分类 中不需要用训练样本进行学习和训练。23. 什么是模式识别?模式识别系统通常包括哪些主要的环节? 模式识别是根据研究对象的特征或属性,利用以计算机为中心的机器系统,运用 一定的分析算法认定它的类别,系统应使分类识别的结果尽可能地符合真实。 主要环节包括:(1)特征提取 (2)特征选择 (3)学习和训练 (4)分类识别24. 什么是总体推断? 当不知道类的概型时。就要采用非参数估计的方法,这种方法称为总体推断 25 什么是梯度下降法? 就是利用负梯度方向来决定每次迭代的新的搜索方向,使得每次迭代能使待优化 的目标函数逐步减少。采用最优化求线性判别函数中的增光矢量 26.什么是无偏估计? 无偏估计是参数的样本估计值的期望值等于参数的真实值。估计量的数学期望等 于估计参数

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!