数值变量资料的统计分析

上传人:san****019 文档编号:15795548 上传时间:2020-09-06 格式:PPT 页数:41 大小:448.01KB
收藏 版权申诉 举报 下载
数值变量资料的统计分析_第1页
第1页 / 共41页
数值变量资料的统计分析_第2页
第2页 / 共41页
数值变量资料的统计分析_第3页
第3页 / 共41页
资源描述:

《数值变量资料的统计分析》由会员分享,可在线阅读,更多相关《数值变量资料的统计分析(41页珍藏版)》请在装配图网上搜索。

1、卫生学(第7版) 第九章 数值变量资料的统计分析,1,第九章,数值变量资料的统计分析,卫生学(第7版) 第九章 数值变量资料的统计分析,2,第一节 数值变量资料的统计描述,数值变量资料的统计描述,对数值变量资料进行统计分析的一般步骤,是先对观察测量得到的变量值(即观察值)进行统计描述,再在此基础上进行深入的统计推断。统计描述的工作主要是在编制频数表的基础上描述资料的集中位置和离散程度。,卫生学(第7版) 第九章 数值变量资料的统计分析,3,一、数值变量资料的频数分布 二、平均水平指标 三、离散程度指标,卫生学(第7版) 第九章 数值变量资料的统计分析,4,1. 频数表(frequency ta

2、ble)的编制方法 2. 频数分布的两个特征及两种类型 3. 频数表的用途,特征,离散趋势,类型,一、数值变量资料的频数分布,集中趋势,对称分布,偏态分布,卫生学(第7版) 第九章 数值变量资料的统计分析,5,二、平均水平指标(掌握描述集中趋势指标的概念、计算和应用条件),描述一组观察值集中位置或平均水平的指标称为平均数(average)。常用的平均数有算术均数、几何均数和中位数。,卫生学(第7版) 第九章 数值变量资料的统计分析,6,1. 算术均数(arithmetic mean, ) 2. 几何均数(geometric mean ,G ) 3. 中位数(median,M),卫生学(第7版)

3、 第九章 数值变量资料的统计分析,7,三、离散程度指标 (掌握描述离散趋势指标的概念、计算和应用条件),多组资料均数相同,只说明其集中趋势相同,各组数据内部观察值参差不齐的程度可能不同。此时,常用极差、四分位数间距、方差、标准差和变异系数等指标来描述资料的离散程度。,卫生学(第7版) 第九章 数值变量资料的统计分析,8,1. 极差(range,R ) 2. 四分位数间距 (interquantile range,IQR ) 3. 方差(variance, S 2) 4. 标准差(standard deviation,S ) 5. 变异系数 (coefficient of variation,C

4、V),卫生学(第7版) 第九章 数值变量资料的统计分析,9,第二节 正态分布和参考值范围的估计,一、正态分布 二、正态分布的特征和曲 线下面积分布的规律,卫生学(第7版) 第九章 数值变量资料的统计分析,10,(一)医学参考值的意义,医学参考值又称临床参考值或正常值,是指“正常”人体和动物的各种生理、生化、组织代谢物中各种成分含量及人体对各种试验的反应值。广义的医学参考值还包括各类“卫生标准”。应注意的是,医学参考值不是一个单一的数值,而是许多数值的集合或全体,即是一个范围。,三、参考值范围的估计,卫生学(第7版) 第九章 数值变量资料的统计分析,11,(二)制定参考值范围的基本步骤,从同质的

5、总体中进行随机抽样 控制测量误差 判定是否需要分组确定参考值范围 确定取单侧还是双侧 确定适当的百分范围 根据资料的分布类型选定适当的方法进行参考值范围的估计,卫生学(第7版) 第九章 数值变量资料的统计分析,12,(三)参考值范围的制定方法,(1) 正态分布法: 根据正态分布原理,95%的参考值范围, 双侧为:x 1.96 S 单侧上限为:x + 1.645 S 单侧下限为:x 1.645 S,卫生学(第7版) 第九章 数值变量资料的统计分析,13,(2) 百分位数法: 对于偏态分布或未知分布的资料,参考值范围的确定常用百分位数法,95%的参考值范围双侧为P2.5P97.5 ,单侧上限为P9

6、5 ,单侧下限为P5 。,卫生学(第7版) 第九章 数值变量资料的统计分析,14,第三节 数值变量资料的统计推断,一、均数的抽样误差与标准误 二、 t 分布 三、总体均数的置信区间估计 四、假设检验的基本思想和步骤,卫生学(第7版) 第九章 数值变量资料的统计分析,15,参数估计有两种方法: (1)点值估计:即直接用样本均数作为总体均数的估计值。 (2)区间估计:总体均数95%置信区间的涵义为由样本均数确定的总体均数所在范围包含总体均数的可能性为95%。,三、总体均数的置信区间估计,卫生学(第7版) 第九章 数值变量资料的统计分析,16,四、假设检验的基本思想和步骤,假设检验是用来判断样本与样

7、本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。,卫生学(第7版) 第九章 数值变量资料的统计分析,17,假设检验的基本思想,假设检验的基本思想是利用小概率反证法思想。小概率事件(P0.05)是指在一次试验中基本上不大会发生的事件。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。,卫生学(第7版) 第九章 数值变量资料的统计分析,18,假设检验的基本步骤,第一步:提出检验假设,建立检验水准; 第二步:选定统计方法,计算出统计量 的值; 第三步:确定P 值,作出推断结论。,卫

8、生学(第7版) 第九章 数值变量资料的统计分析,19,第四节 t 检验和 u 检验,t 检验和u 检验就是统计量为 t , u 的假设检验,两者均是常见的假设检验方法。当样本含量n 较大时,样本均数符合正态分布,故可用u 检验进行分析。当样本含量n 较小,样本来自正态分布,两样本相应的总体方差相等,则用t 检验。,卫生学(第7版) 第九章 数值变量资料的统计分析,20,一、样本均数与总体均数的比较 二、配对资料的比较 三、两个样本均数的比较 四、假设检验应注意的问题,卫生学(第7版) 第九章 数值变量资料的统计分析,21,假设检验应注意的问题,(1)资料必须合乎随机化抽样原则; (2)选用的假

9、设检验方法应符合其应用条件; (3)实际差别大小与统计意义的区别,要正确理解假设检验的结论;,卫生学(第7版) 第九章 数值变量资料的统计分析,22,(4)根据专业及经验确定是选用单侧 检验还是双侧检验; (5)判断结论时不能绝对化,应注意 无论“接受”或拒绝检验假设,都 有判断错误的可能性。,假设检验应注意的问题,卫生学(第7版) 第九章 数值变量资料的统计分析,23,第五节 方差分析,一、方差分析的基本思想 二、方差分析的应用条件 三、方差分析的主要内容 四、多个样本均数的两两比较,卫生学(第7版) 第九章 数值变量资料的统计分析,24,方差分析的基本思想是把全部观察值之间的变异(即总变异

10、),按设计和需要分为两个或多个部分,其自由度也分解为相应的部分。每一部分有一定意义,其中至少有一部分表示各组均数间的变异,另一部分表示误差。然后再计算变异间的比值F。若F 值接近 1,可认为处理因素无作用;若F 值远大于 1,且大于或等于F 界值表中的某界值时,可认为处理因素有作用。,方差分析的基本思想,卫生学(第7版) 第九章 数值变量资料的统计分析,25,方差分析的应用条件,(1)各样本是相互独立的随机样本 (2)各样本都来自正态总体 (3)各个总体方差相等,卫生学(第7版) 第九章 数值变量资料的统计分析,26,方差分析的主要内容,根据资料设计类型的不同,有以下两种方差分析的方法: 1.

11、对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单向方差分析。 2. 对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即双向方差分析。,卫生学(第7版) 第九章 数值变量资料的统计分析,27,多个样本均数的两两比较,经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。,卫生学(第7版) 第九章 数值变量资料的统计分析,28,小 结 一、数值变量资料常用统计方法一览表 二、表达假设检验的结果时,应给出的 信息 三、数值变量资料数据处理及分析中常 见差错的类型,卫生学(第

12、7版) 第九章 数值变量资料的统计分析,29,数值变量资料常用统计分析方法一览表,数值变量资料常用统计分析方法一览表,卫生学(第7版) 第九章 数值变量资料的统计分析,30,数值变量资料常用统计分析方法一览表(续1),卫生学(第7版) 第九章 数值变量资料的统计分析,31,表达假设检验的结果时,最好同时给出以下信息: 选用的统计分析方法; 统计量的具体取值及其自由度; 假设检验的确切 P 值; 有关总体参数的 95%置信区间。,表达假设检验的结果时,应给出的信息,卫生学(第7版) 第九章 数值变量资料的统计分析,32,1. 选用统计指标来描述平均水平和离散趋势 时, 使用正态分布方法表达呈偏态

13、分布的 资料(见例1、例2) 2. 忽视 t 检验的使用条件,在多组均数比较 中,用 t 检验代替方差分析(见例3),数值变量资料数据处理及分析中 常见差错的类型,卫生学(第7版) 第九章 数值变量资料的统计分析,33,【例 1】原先的资料表达形式(见下表) 表 两组症状总积分比较(xs ),卫生学(第7版) 第九章 数值变量资料的统计分析,34,有些资料中的标准差比均数还大,这样的资料不服从正态分布,而是服从偏态分布。在选用统计指标来描述资料的平均水平和离散趋势时,主要应根据资料的分布类型来选择合适的统计指标。,卫生学(第7版) 第九章 数值变量资料的统计分析,35,对于正态或近似正态分布的

14、资料,常使用均数和标准差来描述;对于偏态分布资料则应使用中位数和四分位数间距来描述。,卫生学(第7版) 第九章 数值变量资料的统计分析,36,【例2】某人观察了某种沙门氏菌食物中毒潜伏期,资料如下表。,卫生学(第7版) 第九章 数值变量资料的统计分析,37,表 某种沙门氏菌食物中毒潜伏期(h),卫生学(第7版) 第九章 数值变量资料的统计分析,38,作者采用计算均数的方法,计算得平均潜伏期为27(h)的结论。 此结论欠妥,因为该资料的频数分布呈较明显的偏态,应该用中位数描述其集中趋势,本例中位数为23.8 (h)。因此结论应为该沙门氏菌食物中毒的潜伏期为23.8小时。,卫生学(第7版) 第九章

15、 数值变量资料的统计分析,39,【例3】 某人为探讨血清肌酸肌酶对窒息新生儿心肌损害的诊断价值,对57例窒息新生儿和20例同期住院无窒息史的新生儿的血清肌酸肌酶进行了检测,结果见下表,各组间比较采用t 检验。 表 各组肌酸激酶(U/L)的测定结果,注:* 表示该组与对照组比较,* 表示该组与其它组比较,卫生学(第7版) 第九章 数值变量资料的统计分析,40,作者采用 t 检验对每两个组的均数进行了比较,结论为:三组肌酸激酶的差别均有统计学意义。,卫生学(第7版) 第九章 数值变量资料的统计分析,41,本例资料为单因素三个水平(三组均数)设计的比较,两两间比较采用t 检验欠妥。在比较组数2时,均数间的比较应采用方差分析和均数间的两两比较,以减少犯型误差的概率。,(王伟),

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!