独立性检验的基本思想及初步应用课堂PPT

上传人:无*** 文档编号:187147513 上传时间:2023-02-11 格式:PPT 页数:22 大小:344.50KB
收藏 版权申诉 举报 下载
独立性检验的基本思想及初步应用课堂PPT_第1页
第1页 / 共22页
独立性检验的基本思想及初步应用课堂PPT_第2页
第2页 / 共22页
独立性检验的基本思想及初步应用课堂PPT_第3页
第3页 / 共22页
资源描述:

《独立性检验的基本思想及初步应用课堂PPT》由会员分享,可在线阅读,更多相关《独立性检验的基本思想及初步应用课堂PPT(22页珍藏版)》请在装配图网上搜索。

1、13.1 3.1 独立性检验的独立性检验的基本思想及初步应用基本思想及初步应用23 本课主要学习本课主要学习独立性检验的基本思想及初步应用独立性检验的基本思想及初步应用。以以吸烟是否对肺癌有吸烟是否对肺癌有影响引入新课,通过数据和图表分影响引入新课,通过数据和图表分析,得到结论是:吸烟与患肺癌有关初步判断两分类变析,得到结论是:吸烟与患肺癌有关初步判断两分类变量具有相关性。量具有相关性。通过结论的可靠程度如何?引出如何通过量化来进通过结论的可靠程度如何?引出如何通过量化来进行研究行研究判断两分类变量是否具有相关性,相关程度有多判断两分类变量是否具有相关性,相关程度有多大?通过假设两分类变量没有

2、相关性,也就是是相互大?通过假设两分类变量没有相关性,也就是是相互独独立的,得到判断两分类变量相关性检验方法。再通过例立的,得到判断两分类变量相关性检验方法。再通过例1 1例例2 2讲解引导讲解引导学生掌握学生掌握独立性检验的基本思想及初步应用独立性检验的基本思想及初步应用。4 吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表在不吸烟者中患肺癌的

3、比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 说明:说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大吸烟者患肺癌的可能性大0.54%0.54%2.28%2.28%51)1)通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:三维柱三维柱状图状图62)2)通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:二维条二维条形图形图73)3)通过图形直观判断两个分类变量是否相关:通过图形直观判断两个分类变量是否相关:患肺癌患肺癌比例比例不患肺癌不患肺癌比例比

4、例等高条等高条形图形图8 独立性检验H H0 0:吸烟吸烟和和患肺癌患肺癌之间没有关系之间没有关系 H H1 1:吸烟吸烟和和患肺癌患肺癌之间有关系之间有关系通过数据和图表分析,得到通过数据和图表分析,得到结论是:结论是:吸烟与患肺癌有关吸烟与患肺癌有关结论的可靠结论的可靠程度如何?程度如何?用用 A A 表示表示“不吸烟不吸烟”,B B 表示表示“不患肺癌不患肺癌”则则 H0:吸烟和患肺癌之间没有关系 “吸烟吸烟”与与“患肺癌患肺癌”独立独立,即即A A与与B B独立独立P P(A AB B)=P P(A A)P P(B B)等价于等价于等价于等价于 吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟

5、aba+b吸烟cdc+d总计a+cb+da+b+c+d9=a a+b ba a+c ca aP P(A A),P P(B B),P P(A AB B)n nn nn n其其 中中 n n=a a+b b+c c+d da a a+b b+c c+d da a+b b(a a+c c),adbca aa a+b ba a+c cn nn nn n102 22 2n n(a ad d-b bc c)K K=(a a+b b)(c c+d d)(a a+c c)(b b+d d)独立性检验独立性检验0.adbcad-bc 越小,说明吸烟与患肺癌之间的关系越弱,ad-bc 越小,说明吸烟与患肺癌之间的

6、关系越弱,a ad d-b bc c 越越大大,说说明明吸吸烟烟与与患患肺肺癌癌之之间间的的关关系系越越强强引入一个随机变量引入一个随机变量作为检验在多大程度上可以认为作为检验在多大程度上可以认为“两个变量有关系两个变量有关系”的标准的标准 。111)1)如果如果P(m10.828)=0.001P(m10.828)=0.001表示有表示有99.9%99.9%的把握认为的把握认为”X X与与Y”Y”有关系有关系;2)2)如果如果P(m7.879)=0.005P(m7.879)=0.005表示有表示有99.5%99.5%的把握认为的把握认为”X X与与Y”Y”有关系有关系;3)3)如果如果P(m6

7、.635)=0.01P(m6.635)=0.01表示有表示有99%99%的把握认为的把握认为”X X与与Y”Y”有关系有关系;4)4)如果如果P(m5.024)=0.025P(m5.024)=0.025表示有表示有97.5%97.5%的把握认为的把握认为”X X与与Y”Y”有关系有关系;5)5)如果如果P(m3.841)=0.05P(m3.841)=0.05表示有表示有95%95%的把握认为的把握认为”X X与与Y”Y”有关系有关系;6)6)如果如果P(m2.706)=0.010P(m2.706)=0.010表示有表示有90%90%的把握认为的把握认为”X X与与Y”Y”有关系有关系;7)7)

8、如果如果m m2.706),2.706),就认为没有充分的证据显示就认为没有充分的证据显示”X X与与Y”Y”有关系有关系;设有两个分类变量设有两个分类变量X X和和Y Y它们的值域分别为它们的值域分别为xx1 1,x,x2 2 和和yy1 1,y,y2 2 其样本频数列表其样本频数列表(称为称为2 22 2列联表列联表)为为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2 22 2列联表列联表22()()()()n ad bcKa b c d a c b d()2 2P(k m)P(k m)适用观测数据适用观测数据a a、b b、c c、d d不小于不小于5 512P

9、(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828210.828K 26.635K 22.706K 22.706K 0.1%0.1%把握认把握认为为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认为为A A与与B B有关有关99%99%把握认把握认为为A A与与B B有关有关90%90%把握认把握认为为A A与与B B有关有关10%10%把握认为把握认为A A与与B

10、 B无关无关没有充分的依据显示没有充分的依据显示A A与与B B有关,有关,但也不能显示但也不能显示A A与与B B无关无关例如例如13独立性检验独立性检验 吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965通过公式计算通过公式计算2242 209956.6327817 2148 9874 91K9965(7775 49)14 独立性检验独立性检验已知在已知在 成立的情况下,成立的情况下,0H2(6.635)0.01P K 即在即在 成立的情况下,成立的情况下,K K2 2 大于大于6.6356.635概率非常小,近概率非常小,近似为似

11、为0.010.010H现在的现在的K K2 2=56.632=56.632的观测值远大于的观测值远大于6.6356.635所以有理由断定所以有理由断定H H0 0不成立不成立,即认为即认为”吸烟与患肺吸烟与患肺癌有关系癌有关系”15如下列联表根据题目所给数据得到解秃顶与患心脏病列联表表11314377726651048597451389175214总计不秃顶秃顶总计患其他病患心脏病例例1.1.在某医院在某医院,因为患心脏病而住院的因为患心脏病而住院的665665名男性病人名男性病人中中,有有214214人秃顶人秃顶,而另外而另外772772名不是因为患心脏病而住名不是因为患心脏病而住院的男性病

12、人中有院的男性病人中有175175人秃顶人秃顶.分别利用图形和独立性分别利用图形和独立性检验方法判断是否有关检验方法判断是否有关?你所得的结论在什么范围内你所得的结论在什么范围内有效有效?1642.3图图患患心心脏脏病病患其他病患其他病秃顶秃顶不秃顶不秃顶.,.42.3秃顶与患心脏病有关为某种程度上认以在可的乘积要大一些高度体线上两个柱底面副对角较来说比所示如图维柱形图相应的三.635.6373.1677266510483894511755972141437K,11322得到中的数据根据列联表.%99秃顶与患心脏病有关的把握认为所以有.,住院的病人群体因此所得到的结论适合的病人因为这组数据来自

13、住院17例例2.2.为考察高中生性别与是否喜欢数学课程之间的关系为考察高中生性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取在某城市的某校高中生中随机抽取300300名学生名学生,得到如下得到如下列联表列联表:性别与喜欢数学课程列联表性别与喜欢数学课程列联表喜欢数学课程不喜欢数学课程总计男3785 122女35143 178总计72 228300由表中数据计算得由表中数据计算得 ,高中生的性别与是否喜高中生的性别与是否喜欢数学课程之间是否有关系欢数学课程之间是否有关系?为什么为什么?2 2K 4.513K 4.513acdb18:,.%95具体过程如下验的基本思想据是独立性检作

14、出这种判断的依课之间有关系性别与喜欢数学以上把握认为可以有约解.dcbabdacdccbaa,dccbaa,.d,c,b,a应很大即相差很多应该数学课的人数比例与女生中喜欢例的比课学数欢中喜生则男系有关课学数欢如果性别与是否喜生人数数、不喜欢数学课的女数学课的女生人数、喜欢不喜欢数学课的男生人的男生人数、表示样本中喜欢数学课分别用19,dbcadcbadcba乘以常数因子将上式等号右边的式子 22,n adbcKabcdacbd 然然后后平平方方得得.,K.dcban2成立的可能性越大欢数学课之间有关系性别与喜越大因此其中20.%95,%.5,.A,513.4K.A,05.0841.3KP84

15、1.3KA,222喜欢数学课之间有关系性别与的把握认为约有所以可能性约为并且这种判断出错的成立欢数学课之间有关系性别与喜我们应该断定据假设检验的基本原理根发生这表明小概率事件据计算得而由样本数是一个小概率事件因此事件的概率为由于事件没有关系性别与喜欢数学课之间假设另一方面21独立性检验基本的思想类似反证法(1)(1)假设结论不成立假设结论不成立,即即“两个分类变量没有关系两个分类变量没有关系”.(2)(2)在此假设下随机变量在此假设下随机变量 K K2 2 应该很能小应该很能小,如果由观如果由观测数据测数据计算得到计算得到K K2 2的观测值的观测值k k很大很大,则在一定程度上说明假则在一定程度上说明假设不合理设不合理.(3)(3)根据随机变量根据随机变量K K2 2的含义的含义,可以通过评价该假设不可以通过评价该假设不合理的程度合理的程度,由实际计算出的由实际计算出的,说明假设合理的程说明假设合理的程度为度为99.9%,99.9%,即即“两个分类变量有关系两个分类变量有关系”这一结论这一结论成立的可信度为约为成立的可信度为约为99.9%.99.9%.22敬请指导敬请指导.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!