Ch05非参数方法PPT课件

上传人:仙*** 文档编号:138134781 上传时间:2022-08-19 格式:PPT 页数:29 大小:1.92MB
收藏 版权申诉 举报 下载
Ch05非参数方法PPT课件_第1页
第1页 / 共29页
Ch05非参数方法PPT课件_第2页
第2页 / 共29页
Ch05非参数方法PPT课件_第3页
第3页 / 共29页
资源描述:

《Ch05非参数方法PPT课件》由会员分享,可在线阅读,更多相关《Ch05非参数方法PPT课件(29页珍藏版)》请在装配图网上搜索。

1、Ch 05.非参数方法Part 1 Parzen窗估计模式分类的途径 途径途径1:估计类条件概率密度 通过 和 ,利用贝叶斯规则计算后验概率 ,然后通过最大后验概率做出决策 两种方法 方法方法1a:概率密度参数估计基于对 的含参数的描述 方法方法1b:概率密度非参数估计基于对 的非参数的描述 途径途径2:直接估计后验概率 不需要先估计 途径途径3:直接计算判别函数 不需要估计 或者参数估计可能存在的问题 概率密度函数的形式未知 经典的密度函数往往不能很好的描述现实数据 经典密度函数的参数形式一般都是单模的 现实数据往往是多模的 有些复杂数据很难用参数形式建模 解决办法:非参数方法非参数方法(n

2、on-parametric method)非参数方法 能处理任意的概率密度 不必假设密度函数的参数形式 No Free Lunch!非参数方法取得较好结果所需训练样本训练样本一般远远大于参数化方法非参数密度估计 假设x的概率密度为p(x),则任一x 落入区域R的概率为 非参数密度估计的基本思想基本思想 通过估计通过估计x周围一个小区域周围一个小区域R的概率来估计的概率来估计p(x)假设n个i.i.d.样本,其中k个样本落入R中的概率 k的期望值 当数据量n很大时,Pk在nP附近有非常显著的高峰,可以用k的观察值代替E(k)二项分布二项分布非参数密度估计非参数密度估计 积分中值定理 为区域R大小

3、的度量(长度、面积、体积等)x是R中某个点 如果R足够小,使得p(x)在R内的变化很小,则x为R中任一点 把 代入,得到V的选择 在样本数量n有限的情况下 V过大过大得到空间平滑后的p(x)V趋近于趋近于0 如果R内没有样本点,则 如果R内碰巧有一个样本,则 假设样本数可以无限多 构造一系列包含x的区域 使用一个样本 使用两个样本/()0k npVx/()k npV x12,R R 1R2R用 得到的估计nR落入 中的样本个数nR的体积nRV的选择 如果要使 ,则如下条件必须满足 空间平滑了的P/V能够收敛到p(x)频率之比k/n能够收敛到P 即使落在R中的样本点趋于无穷大,其在整个数据集中的

4、比例仍然很小()()npxp xV的选择 两种途径 根据某个确定的体积函数,如 ,来逐渐收缩一个给定的初始区间Parzen窗方法窗方法 确定kn为n的某个函数,如kn-近邻方法近邻方法一个简单实例 给定包含n个样本的数据集 用直方图来模拟p(x)假设k个样本落入以x为中点的小条(宽度为h)中,如果n足够大,则有 根据以上两种近似,得到一个简单实例 定义窗函数窗函数(核函数核函数、势函数势函数)落入宽度为h,中点为x的小条中的样本个数 对p(x)的非参数化模拟xj的某个函数的均值的某个函数的均值Parzen窗方法 假设R为边长为h的d维超立方体,则R的体积 定义窗函数 落入R中的样本个数 用n个

5、样本来近似p(x)Parzen窗方法 定义则对p(x)的近似可重写为 基本思想 每个样本xj都对p(x)的估计产生一定的贡献,这种贡献根据xj到x的距离,通过某种形式的插值函数表现出来 泛化:插值函数的例子插值函数插值函数Parzen窗方法 由于 ,并且 ,所以说明估计得到的 是一个合理的概率密度函数 离散性 如果 是离散的,则 也是离散的 如果 是连续的,则 也是连续的Parzen窗方法二维圆周对称正态Parzen窗Parzen窗方法 h(或者V)对 的影响 h非常大非常大时,xj到x的距离对 的影响不大 为n个宽的、慢变的函数相加 是对p(x)的非常平滑的估计散焦估计 估计结果的分辨率低

6、h非常小非常小时,的峰很尖锐 为n个以样本点为中心的尖脉冲的叠加 是对p(x)的充满噪声的估计 估计结果的统计稳定性不足Parzen窗方法 在有限样本个数n的约束下,h(或V)应取某种可接受的折中。随着n的增大,h(或V)应逐渐减小,以使得对p(x)的估计更为精确Parzen窗方法 窗函数窗函数的泛化 不必规定R为超立方体,而是某种由窗函数定义的一般化的形式,仅需窗函数满足以使得 为一个合理的概率密度函数 h:窗的宽度窗的宽度举例1 p(x)为零均值、单位方差、单变量的正态分布 窗函数为 体积 Parzen窗估计1/nnVhhn举例1举例1:二维情况举例1:二维情况举例2 p(x)为一个均匀分

7、布与一个三角分布的混合分布 窗函数 窗宽度 1/nhhn举例2分类 基于Parzen窗估计的分类器 对每一个类,用Parzen窗估计其类条件概率密度 然后,利用贝叶斯公式求后验概率 根据“最大后验概率”(MAP)原则进行分类(|)ipx(|)ipx分类 Parzen窗分类器的决策域决策域与窗函数窗函数窗宽度较小窗宽度较小窗宽度较大窗宽度较大优点 vs.缺点 非参数方法 优点优点 通用性:不必了解分布的形式就能对其作出估计 在训练样本足够多的情况下,无论实际的概率密度函数的形式如何,最终肯定能得到一个可靠的收敛的结果 缺点缺点 需要大量训练样本,往往比已知分布的参数形式而进行参数估计所需的训练样本个数多得多。“维数灾难维数灾难”(curse of dimensionalty)对训练样本个数的需求,随特征空间的维数指数增长。小结 Parzen窗估计 对特定的样本数n,固定窗的宽度(体积)

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!