非参数统计讲义一-绪论.ppt

上传人：xt****7

文档编号：6074779

上传时间：2020-02-15

格式：PPT

页数：86

大小：3.55MB

《非参数统计讲义一-绪论.ppt》由会员分享，可在线阅读，更多相关《非参数统计讲义一-绪论.ppt（86页珍藏版）》请在装配图网上搜索。

非参数统计教学要求本课程的目的是使学生认识到非参数统计方法是统计中最常用的推断方法之一理解非参数统计方法和参数统计方法的区别理解非参数统计的基本概念掌握非参数统计的基本理论和计算能应用统计软件和非参数统计方法分析解决实际问题统计是分析数据信息的科学这个定义决定了统计的命运和数学不同统计不能欣赏自己它不为实际服务就没有存在必要统计必须为各个领域服务统计必须和数据打交道因此统计必须和计算机结合非参数统计产生的背景问题学生请假与星期几有关吗股票涨跌与星期几有关吗夫妻的审美观有差异吗广告的播出时间与电脑销量有关吗婴儿出生数白天与晚上有明显差异吗用实例说明非参数统计方法和参数统计方法的区别使学生认识到学习非参数统计方法的必要性第一讲非参数统计概论参数统计与非参数统计的比较经典统计的多数检验都假定了总体的背景分布分布由参数决定的期望与方差总体的分布形式或分布族往往是给定的或者是假定了的所不知道的仅仅是一些参数得知或它们的范围人们的主要任务就是对一些参数比如均值和方差或标准差进行估计或检验非参数统计非参数统计方法 NonparametricStatisticalmethod 对总体的概率分布假定以及测量尺度的要求即使有也很少的统计方法当能够得到分类数据和顺序数据时可以使用的方法也称为无分布方法 Distribution freeStatisticsmethods 也称自由分布统计学表示无需对总体概率分布做出假定因常按大小或出现先后次序排列资料进行分析故又称次序统计学 OrderStatistics 什么是非参数检验不假定了总体的具体背景分布形式这些检验多根据数据观测值的相对大小建立检验统计量然后找到在零假设下这些统计量的分布看这些统计量的数据实现是否在零假设下属于小概率事件这种和数据本身的总体分布无关的检验称为非参数检验非参数检验有什么优越性在总体分布未知时如果还假定总体有诸如正态分布那样的已知分布在进行统计推断就可能产生错误甚至灾难非参数检验总是比传统检验安全但是在总体分布形式已知时非参数检验就不如传统方法效率高但非参数统计在总体分布未知时效率要比假定了错误总体分布时的传统方法要高有时要高很多哪个好选择飞机与选择用参数与非参数方法的思路相同大型飞机很好但对机场的要求很高参数统计对数据要求很高小型飞机不一定舒适但起降时对机场的要求很低同理非参数统计对数据要求较低统计方法的选择用参数统计方法与非参数统计方法1 考虑对总体的假定对总体有假定时用参数已具备使用参数统计方法时一般不用非参数统计 2 数据的度量尺度定距与定比可以用参数非参数统计方法的应用条件 1 用于分析定类数据2 用于分析定序数据3 用于分析定距定比数据时总体分布未做假定参数统计 ParametricStatisticalmethod 有两个特点 1 以推断某特定参数为对象如总体均值总体比例P 总体方差两个总体殚值的差等 2 常需要假定总体的分布是已知的有的要假设总体是服从正态分布的才能作出推断数据的四种尺度定类定序定距定比对定类和定序的只能用非参数统计分析方法非参数检验的特点1 非参数统计方法应用广泛 2 它对资料的要求易于得到满足 3 当总体分布有具体形式未知而且样本容量很小时无法用参数统计方法只能用非参数方法 4 大多数非参数统计方法简单直观易于掌握和应用 5 总体分布形式已知时非参数统计的方法的检验功效不如假定总体已知的各种参数统计方法 6 非参数统计方法所推断的通常不是总体参数7 其通常按大小或出现先后顺序排列的资料进行分析 8 通常以中位数代表分布的中心以极差代表离散程度非参数统计的主要内容 MatrixofNonparametricStatistics 非参数统计的历史非参数统计的形成主要归功于20世纪40年代 50年代化学家F Wilcoxon等人的工作 Wilcoxon于1945年提出两样本秩和检验 1947年Mann和Whitney二人将结果推广到两组样本量不等的一般情况 Pitman于1948年回答了非参数统计方法相对于参数方法来说的相对效率方面的问题 60年代中后期 Cox和Ferguson最早将非参数方法应用于生存分析 70年代到80年代非参数统计借助计算机技术和大量计算获得更稳健的估计和预测以P J Huber以及F Hampel为代表的统计学家从计算技术的实现角度为衡量估计量的稳定性提出了新准则 90年代有关非参数统计的研究和应用主要集中在非参数回归和非参数密度估计领域其中较有代表性的人物是Silverman和J Fan 非参数统计分为广义的和狭义的两种狭义的非参数统计主要研究假设检验本课程研究狭义的广义的非参数统计只要不考虑总体的分布的统计分析方法但是在总体分布形式已知时非参数检验就不如传统方法效率高这是因为非参数方法利用的信息要少些往往在传统方法可以拒绝零假设的情况非参数检验无法拒绝但非参数统计在总体未知时效率要比传统方法要高有时要高很多是否用非参数统计方法要根据对总体分布的了解程度来确定因为非参数统计方法不利用关于总体分布的知识所以就是在对总体的任何知识都没有的情况下它也能很容易而又很可靠地获得结论这时非参数方法往往优于参数方法并且非参数检验总是比传统检验安全数据的秩秩 rank 利用秩的大小进行推断就避免了不知道背景分布的困难这也是大多数非参数检验的优点多数非参数检验明显地或隐含地利用了秩的性质但也有一些非参数方法没有涉及秩的性质非参数检验中秩是最常使用的概念什么是一个数据的秩呢一般来说秩就是该数据按照升幂排列之后每个观测值的位置秩 rank 非参数检验中秩是最常使用的概念什么是一个数据的秩呢一般来说秩就是该数据按照升幂排列之后每个观测值的位置例如我们有下面数据这下面一行记为Ri 就是上面一行数据Xi的秩数据输入SPSS 例题某学院本科三年级有9个专业组成统计每个专业学生每月消费数据如下用SPSS求消费数据的秩和顺序统计量的现值 300230208580690200263215520 2 有结数据的秩设样本X1 X2 XN取自总体X的简单随机抽样将数据排序后相同的数据点组成一个结称重复数据的个数为结长例1 3 83 21 21 23 43 23 2解结长为3 统计推断假设检验假设检验假设检验是指我们可以对某一参数的假定值进行先验判断或预期然后利用小概率原理对其进行检验得到接受或拒绝原假设的结论小概率原理我们认为小概率事件由于发生的可能性很小在一次试验中它几乎是不会发生的如果发生了说明我们的假设有问题所以我们将拒绝原来的假设参数统计的假设检验如检验正态分布的均值是否相等H0 u1 u2 H1 u1 u2检验均值是否等于零H0 u 0 H1 u 0 例8 5用自动装袋机装葡萄糖每袋标准重500克每隔一定时间需检查机器工作是否正常现抽得10袋测得其重量为单位克 495 510 505 498 503 492 502 512 497 506 假定重量服从正态分布问机器是否正常解由于 2未知所以用T检验法提出假设所以应接受H0 可以认为机器工作正常对拒绝域 P值由T 0 9733 df 9 可得 EXCEL函数 TDIST 0 9733 9 2 假定甲乙两机床截下的长度方差相等问长度的期望值是否一样例8 8从两台切断机所截下的坯料长度按正态分布中分别抽取个和个产品测得长度如下单位 mm 甲 150 145 152 155 148 151 152 148 乙 152 150 148 152 150 150 148 151 148 设甲床截下的长度为X 乙床截下的长度为Y 由假定知 21 22 2 检验假设解对查表得拒绝域为所以应接受参数方法定义样本被视为从分布族的某个参数族抽取出来的总体的代表而未知的仅仅是总体分布具体的参数值推断问题就转化为对分布族的若干个未知参数的估计问题用样本对这些参数做出估计或者进行某种形式的假设检验这类推断方法称为参数方法比如 1 研究保险公司的索赔请求数时可能假定索赔请求数来自泊松分布P a 2 研究化肥对农作物产量的影响效果时平均意义之下每测量单元可能是产量服从正态分布N a b 假设检验的基本概念若对参数有所了解但有猜测怀疑需要证实之时用假设检验的方法来处理 2未知 2未知一个典型的参数检验过程 1 总体参数Example PopulationMean2 假定数据的形态为WholeNumbersorFractionsExample HeightinInches 72 60 5 54 7 3 有很强的假定Example 正态分布4 例子 ZTest tTest 2Test 一个例子对两组学生进行语法测试如何比较两组学生的成绩是否存在差异假设检验的基本思想因此我们拒绝假设 50 样本均值 m 50 抽样分布 H0 单边备择单边备择双边备择零假设原假设与备择假设例假设检验的方法1 置信区间法置信区间提供了在某一置信度例如95 下真实参数值的取值范围如果零假设中的值未落入该区间也就是说小概率事件发生了我们认为小概率事件由于发生的可能性很小在一次试验中它几乎是不会发生的如果发生了说明我们的假设有问题所以我们将拒绝该零假设概念接受域置信区间拒绝域临界值第一类错误和第二类错误一个偏离由小概率原理我们可以看出我们的这种判断是有可能犯错误的我们把可能犯的错误分为两类第一类错误和第二类错误第一类错误零假设是正确的却做出拒绝零假设的判断此为弃真错误第二类错误零假设是错误的却做出接受零假设的判断此为取伪错误假设检验不可能完全避免这两类错误我们只能想办法使犯错误的概率尽量减小 1 置信水平也称显著性水平犯第一类错误的概率犯弃真错误的概率犯第二类错误的概率犯取伪错误的概率两类错误假设检验存在着接受错误的假设和拒绝正确假设的可能性假设检验的各种可能结果 1 a 1 H0 无罪假设检验中的两类错误决策结果假设检验就好像一场审判过程统计检验过程错误和错误的关系 2 显著性检验显著性检验在给定显著性水平下为考察样本值的显著性而进行的假设检验检验是统计显著的能够拒绝零假设即观察到的样本值落入拒绝域检验是统计不显著的不能够拒绝零假设即观察到的样本值落入接受域确定显著性水平求临界值在假设检验中认为零假设代表的事件概率很大备择假设代表的对立事件概率很小根据实际推断原理小概率原理规定一个界限当某事件的概率就认为该事件是实际不可能事件显著性水平如果在一次检验中备择假设代表的小概率事件居然发生了就有理由怀疑零假设的正确性这就是假设检验的基本原理显著水平的选择与P值 P值概率值也称为统计量的精确显著性水平它可定义为拒绝零假设的最小的显著性水平一般规律 P值越小越能拒绝零假设某一点对应的p值指的是以该值为临界点确定的拒绝域的概率统计检验的步骤总结第一步表述零假设H0和备择假设H1 第二步选择检验统计量第三步确定检验统计量的概率分布第四步选择显著性水平即犯第一类错误的概率第五步选择置信区间法或显著检验方法置信区间法根据检验统计量的概率分布建立一个置信区间也即接受域如果该区间包括零假设值则接受零假设否则拒绝零假设显著检验法在零假设下得到相关统计量并根据相应的概率分布及事先给定的显著性水平计算相应的接受域拒绝域根据计算得到的值是否落入接受域拒绝域来决定是否接受拒绝零假设如果不想事先选择显著性水平则可依据该统计量的p值进行判断计算该统计量取某一特殊值的概率如果这一概率值较小则拒绝零假设否则接受零假设什么是P值 P Value 是一个概率值如果我们假设原假设为真 P 值是观测到的样本均值不同于实测值的概率左侧检验时 P 值为曲线上方小于等于检验统计量部分的面积右侧检验时 P 值为曲线上方大于等于检验统计量部分的面积被称为观察到的或实测的显著性水平H0能被拒绝的的最小值利用P值进行决策单侧检验若p 值不能拒绝H0若p 值拒绝H0双侧检验若p 值 2 不能拒绝H0若p 值 2 拒绝H0 双尾Z检验 P 值计算实例例欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为368克现从某天生产的一批食品中随机抽取25盒进行检查测得每盒的平均重量为 x 372 5克企业规定每盒重量的标准差为15克确定P 值双尾Z检验 P 值计算结果双尾Z检验 P 值计算结果双尾Z检验 P 值计算结果双尾Z检验 P 值计算结果双尾Z检验 P 值计算结果双尾Z检验 P 值计算结果双尾Z检验 P 值计算结果

下载提示(请认真阅读)

1.请仔细阅读文档，确保文档完整性，对于不预览、不比对内容而直接下载带来的问题本站不予受理。
2.下载的文档，不会出现我们的网址水印。
3、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

文档包含非法信息？点此举报后获取现金奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

14.9 积分

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 参数统计讲义绪论

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

装配图网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：非参数统计讲义一-绪论.ppt
链接地址：https://www.zhuangpeitu.com/p-6074779.html