数值变量资料的统计分析

上传人:xt****7 文档编号:188278342 上传时间:2023-02-18 格式:PPT 页数:128 大小:498KB
收藏 版权申诉 举报 下载
数值变量资料的统计分析_第1页
第1页 / 共128页
数值变量资料的统计分析_第2页
第2页 / 共128页
数值变量资料的统计分析_第3页
第3页 / 共128页
资源描述:

《数值变量资料的统计分析》由会员分享,可在线阅读,更多相关《数值变量资料的统计分析(128页珍藏版)》请在装配图网上搜索。

1、1第九章 数值变量资料的统计分析 2第一节 数值变量资料的统计描述第二节 正态分布及其应用和统计图表第三节 数值变量资料的统计推断3第一节 数值变量资料的统计描述n数值变量资料的频数分布n集中趋势的描述n离散趋势的描述4 数值变量资料的分类n离散型资料(discrete data)n连续型资料(continuity data)5一、数值变量资料的频数分布(一)编制频数分布表和绘制频数分布图n频数分布表:常用于样本量较大资料的统计描述n频数分布图:用图示的方法描述频数分布的特点,比频数表更直观、形象67编制频数表的步骤如下:1.计算极差(mmol/L)2.确定组数、组段和组距3.确定各组段的上下

2、限 4.列出频数表 89 图9-1 140名健康成年男性血清BUN浓度频数分布图 10n揭示了频数分布的两个重要特征:u集中趋势u离散趋势n频数分布类型有两种:u对称分布u偏态分布 正偏态负偏态11(二)频数分布表和频数分布图的用途1.将原来相对复杂的数据以相对直观、有序的表格或图形的形式描述,便于进一步分析2.便于观察数据频数分布的类型,以便根据资料分布类型选择恰当的统计分析方法3.用于描述频数分布的特征4.便于发现资料中一些特大或特小的可疑值,以便进一步检查和核对12二、集中趋势的描述n算术均数(arithmetic mean)n几何均数(geometric)n中位数(median)与百分

3、位数(percentile)13(一)算术均数(arithmetic mean)n适于描述正态分布或近似正态分布资料的集中趋势n方法u直接法u加权法14n直接法n加权法nxxxnxxni21nnniiifffxfxfxffxfx2122111516(二)几何均数(geometric)n观察值呈倍数关系或其频数分布明显偏态,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。n方法u直接法u加权法17n直接法n加权法18例9-3 有8份血清的某种抗体效价分别为1:200、1:25、1:400、1:800、1:50、1:100、1:50、1:2

4、5,求平均抗体效价。19 例9-4 某地对120名儿童接种疫苗一个月后,测定了各儿童血清抗体的滴度,结果如下表9-4第(1)、(2)栏。试求平均滴度。112名儿童接种疫苗后血清抗体平均滴度为1:48.55.47)1128415.187(lg1G20(三)中位数中位数(median,M)和百分位数和百分位数(percentile,Px)n中位数:将一组观察值按大小顺序排列后,位于中间位置的观察值称中位数。全部观察值中,大于和小于中位数的观察值个数相等。中位数可用于各种分布的资料,在实际工作中主要用于偏态分布资料、两端无确切值或分布不明确的资料。n方法u直接法u频数表法21直接法nn为奇数时 nn

5、为偶数时 22 频数表法23n百分位数n将观察值从小到大排列后,等分成100份,位于第x百分位置上的数值称第百分之x位数,记为Px。对于样本含量过小的资料不宜计算百分位数。一个百分位数Px将全部数据分为两个部分,有x的数据比Px小,有(100X)的数据比Px大,故百分位数是一个位置指标。n计算 24 例9-7 为了了解本地儿童体内铅负荷的现状,某市儿保所2006年以随机抽样的方法调查了该市340名7岁以下儿童的血铅含量,结果编制成频数表如表9-5,试计算该资料中位数及P25,P75,P95。2526三、离散趋势的描述n全距(rangerange,R R)n四分位数间距(quartile ran

6、gequartile range,Q Q)n方差(variance)(variance)n标准差(standard deviation(standard deviation,SD)SD)n变异系数(coefficient of variation(coefficient of variation,CV)CV)27(一)全距(rangerange,R R)n极差亦称全距,即一组观察值中最大值与最小值之差。极差大,说明变异度大;反之,说明变异度小n极差可用于反映各种分布资料的变异程度,简单明了,但也存在缺点u只涉及最大值和最小值,不能反映组内其他数据的变异程度u样本较大时,抽样误差大,因此抽到最大

7、值和最小值的可能性也越大,故样本例数相差较大时,不宜比较其极差28(二)四分位数间距(quartile rangequartile range,Q Q)nP25 P75 n四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度,其值越大,表示观察值分布的离散程度越大,反之越小。n四分位数间距与极差相比,相对比较稳定,但它只反映了居中间的50%数据的变异情况,仍未考虑到每个观察值的变异情况,不能代表全部观察值的离散程度。29(三)方差(variancevariance)n方差是描述对称分布,特别是正态分布或近似正态分布资料离散程度的常用指标。是所有观察值与均数的平均离散程度的

8、指标,表示一组数据的平均离散程度。30(四)标准差(standard deviation(standard deviation,SD)SD)标准差是在统计中应用最多的变异指标。标准差是方差的算术平方根,与变量值的单位相同。标准差适于描述对称分布定量资料的离散程度。31n计算方法u直接法u加权法32例9-8 以例9-2中10名女孩的身高数据为例,求标准差。本例n=10,可用直接计算法计算标准差,代入得,,37.202924,1.14222xX33例9-9 利用表9-3中资料计算140名正常成年男子血铅BUN浓度的标准差。表中已算得 代入得:.36.2875,80.616,1402fxfxf)/(

9、07.11140140)80.616(36.28752Lmmols34(五)变异系数(coefficient of variation(coefficient of variation,CV)CV)变异系数(亦称离散系数)为相对数,没有单位,便于资料间的比较。它常用于比较测量单位不同,或均数相差悬殊的几组资料的离散程度%100XsCV35例9-10 某地40名7岁男童身高的均数为,标准差为;体重均数为,标准差为2.35kg.试比较该40名男童身高和体重的变异程度。身高体重%83.3%10048.12165.4%100XsCV%60.10%10018.2235.2%100XsCV36不同分布类型

10、数值变量资料集中、离散趋势的统计描述不同分布类型数值变量资料集中、离散趋势的统计描述37第二节 正态分布及应用和统计图表n正态分布v正态分布v正态分布的特征和曲线下面积分布规律v正态分布的应用n统计图表v统计图v统计表38一、正态分布(一)正态分布(normal distribution)39 在上表中,频数分布以均数为中心,左右两侧对称,形成一个中间多两侧少、基本对称的分布。当样本含量扩大,将组段不断分细,将会得到中间高、两侧逐渐降低,并完全对称的曲线。这条曲线就是正态曲线,用 表示均数 ,标准差为 的正态分布。),(2N40正态分布曲线的演变正态分布曲线的演变频率5-2 a12512913

11、31371411451491531571610.1.2.3.4身高(cm)5-2 b41n这条曲线称为频率曲线,略呈钟型,两侧低,中间高,左右对称,近似于概率分布中的正态分布。频率的总和为1,故正态分布曲线下横轴上的面积也应为1。n正态分布的概率密度函数,也称为正态分布曲线方程为:222)(21)(xexf x42n标准正态分布标准正态分布与标准化变换:(,)v标准化变换:v令=0,=1v标准正态分布:(0,1)222)(21)(xexf2/21(),2uueu 4344(二)正态分布的特征和曲线下面积分布规律n正态分布的特性v正态曲线在横轴上方,呈钟形,两端与横轴永不相交v以均数为中心,左右

12、对称,在x=处最高,在X=处有拐点v正态分布的两个参数 和 决定分布位置和形状v正态分布曲线下面积分布有规律45对于正态分布常用 xN(,)4647(三)正态分布的应用v估计变量值的频数分布v制定参考值范围v质量控制v正态分布是很多统计方法的基础48参考值范围:定义:绝大多数正常人的解剖,生理,生化各种指标的波动范围,称作为医学参考值范围(medical reference ranges)。正常人:并非指机体任何器官、组织的形态和机能都正常的人,而是指排除了影响所研究指标的疾病和有关因素的人 49 参考值范围估计的基本步骤:v从正常人的总体中进行随机抽样v对选定的正常人进行准确的测定v确定取单

13、侧范围还是取双侧范围v选择适当的百分范围v根据资料的分布类型选用恰当的界值估计方法5051 例9-11 用表9-1的资料,求该地成年男子血清BUN含量95%的参考值范围。=(mmol/Lmmol/L)52二、统计图表n统计表(statistical table)是以表格形式来描述统计分析结果中的数据和统计指标。特点是简单明了,层次清楚,便于事物间的分析比较。n统计图(statistical graph)是用点、线、面等各种几何图形来表达统计数据和分析结果,从而更加直观生动地反映出事物间的数量关系。n统计图和统计表是关于科学文章的陈述部分,制作标准的图表非常重要!53(一)统计表v统计表的结构

14、标题、标目、线条、数字、备注组成。v统计表的种类 简单表,组合表v编制统计表应注意事项 重点突出,简单明了,主次分明,层次清楚 54 简单表55 组合表56(二)统计图 常用的统计图有直条图、百分比条图、圆图、线图、半对数线图、散点图、直方图等。571.统计图的绘制要求n根据资料性质和分析目的选用适当的统计图n要有标题和编号 n标目包括横标目和纵标目,分别表示横轴和纵轴的意义,必要时注明单位n纵横轴的比例一般以7:5或5:7(黄金分割)左右较美观n图中用不同线条和颜色代表不同事物和对象时,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置582.常用统计图的绘制方法及注意事项n条图(

15、bar graph)又称直条图,用等宽度直条的长短表示比较指标的数值大小和它们之间的对比关系。适于比较独立或性质相似的各指标间的比较。n按分组因素是一个还是两个分为单式和复式两种 59n百分条图(percent bar chart)是以一个直条总长度为100%,将其分割成不同长度的段来表示事物中各部分的比例或构成。n百分条图通常为横向,纵坐标标注组别,横坐标为构成比尺度。60n圆图(pie graph)用圆的总面积作为100%,将其分割成若干个扇形来表示事物中各部分在总体中所占的比例或构成,用途和百分条图相同,一般用于单组构成比资料。n适合描述分类变量资料的各类别所占的构成比。61n线图(li

16、ne graph)用线段的升降来描述某统计量随另一统计量变化的趋势,或某事物随时间变化的趋势,是绝对趋势。普通线图的横轴和纵轴都是算术尺度。62n半对数线图(semi-logarithmic line graph)描述的是相对变化趋势,适于比较事物之间的相对变化速度。半对数线图的绘制:横轴为算术尺度,纵轴为对数尺度,纵坐标没有零点。63n散点图(scatter diagram)用点的位置表示两变量间的数量关系和变化趋势。绘制方法与线图相同,只是点与点之间不用线段连接。绘制散点图时,横轴表示自变量,纵轴表示应变量。64n直方图(histogram)用于表示连续性数值变量的频数分布或频率分布。直方

17、图的横轴尺度表示连续性变量,纵轴是频数或频率且纵轴尺度必须从“0”开始。直方之间不留空隙。65第三节 数值变量资料的统计推断n均数的抽样误差与标准误nt分布n总体均数的置信区间估计n假设检验的基本思想和步骤66一、均数的抽样误差与标准误 均数的抽样误差(sampling error of mean)由于抽样引起的样本均数与总体均数之间的差异或样本均数之间的差异叫均数的抽样误差67 例如:某地14岁健康女生的身高资料作为总体,其分布近似正态分布,均数为,标准差为。现从该总体中抽取n=10的100个样本,可计算100个样本的均数。得频数分布如下:68XjSjX1,X2,X3Xj,155.56,2.

18、57 :155.69,109100个个Xi某地14岁健康女生的身高 N(,)抽样示意图 69 样本均数组成一个新的分布特点n各样本均数未必等于总体均数;n各样本均数间存在差异;n样本均数的分布很有规律。70 标准误:估计抽样误差大小的指标n标准误(standard error,SE):样本统计量的标准差;n样本均数的标准误(standard error of mean,SEM):;n样本均数的标准误的估计值:71均数标准误的含义n反映均数抽样误差大小的一个指标;n均数的标准误 与原分布的标准差成 正比,与抽样样本量n开根号成反比;n欲减少抽样误差,可增加样本量;n利用均数标准误可以进行总体均数

19、的可信区间的估计和假设检验。72n中心极限定理n若 服从正态分布,则 服从正态分布;n若 不服从正态分布,n较大则 服从正态分布;n较小,为非正态分布;73n例如:以某地14岁女生身高的标准差 =及每个样本包含的例数10代入得:74二、t分布(tdistribution)nt分布的由来nt分布的图形和特征nt界值表75 标准正态变换标准正态变换Xu,X0,1uXXusXXtX,Xt变换变换0t抽抽样样实实验验 t分布的由来76nt分布图形的演变77nt分布图形的演变 FREQUENCY 0 200 t3 MIDPOINT (n=3)-1 2.0-1 1.5-1 1.0-1 0.5-1 0.0-

20、9.5-9.0-8.5-8.0-7.5-7.0-6.5-6.0-5.5-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 1 0.0 1 0.5 1 1.0 1 1.5 1 2.0 78nt分布图形的特征 1.单峰分布,以0为中心,左右对称2.只有一个参数(自由度n-1),越小,则t值越分散,峰部越矮而尾部 翘得越高3.当逼近时,t分布逼 近u分布79t分布图形下面积具有规律性n总面积为1;n任意两区间的面

21、积都可以用积分的方法求出;n当单双侧确定时,自由度确定时,尾部面积()与横轴t值之间有一一对应的关系;nt/2,表示双侧尾部面积为,自由度为时的t界值;nt,表示单侧尾部面积为,自由度为时的t界值;80nt界值表的特点n表示在单双侧确定时,自由度确定时,t界值越大,外围面积(P)越小;反之亦然;n单双侧确定时,外围面积(或P)确定时,自由度越大,t界值越小,当时,t=u;t0.05/2,;t0.01/2,81三、总体均数的置信区间估计n置信区间的概念n点估计n 区间估计 按预先给定的概率(1)确定包含未知总体参数的可能范围。x如用 估计,p估计82总体均数的置信区间的计算根据资料的条件选用相应

22、的方法:n已知 n未知,n较小1.未知,n较大)96.1,96.1(xxxx),(,05.0,05.0 xxStxStx)96.1,96.1(xxSxSx83 例9-13 随机抽取某地健康男子20人,测得该样本的收缩压均数 为118.4mmHg,标准差s为,试计算该地男子收缩压总体均数的95%置信区间。x845 方差分析方差分析李红美李红美 讲师讲师苏州大学医学部苏州大学医学部 放射医学与公共卫生学院放射医学与公共卫生学院 流行病与卫生统计教研室流行病与卫生统计教研室 E-mail:第九章第九章 数值变量资料的统计分析数值变量资料的统计分析85方差分析(方差分析(analysis of var

23、iance):):又称变异分析或又称变异分析或F检验,其目的是通过检验两检验,其目的是通过检验两个或多个样本均数的差异是否有统计学意义,个或多个样本均数的差异是否有统计学意义,推断两组或多组资料的总体均数是否相同。推断两组或多组资料的总体均数是否相同。方差分析的概念方差分析的概念86一、方差分析的基本思想一、方差分析的基本思想下面我们用一个简单的例子来说明方差分析的下面我们用一个简单的例子来说明方差分析的基本思想:基本思想:例例9-19 将将16只大白鼠随机分配到四组,每组只大白鼠随机分配到四组,每组4只,喂养不同的饲料,然后测其肝重占体重的只,喂养不同的饲料,然后测其肝重占体重的比值(肝比值

24、(肝/体比值),试问四种饲料对肝体比值),试问四种饲料对肝/体比体比值的影响是否相同?值的影响是否相同?表表9-13 四组大鼠的肝四组大鼠的肝/体比值(体比值(%)的测定结果)的测定结果88各样本均数之间存在差异的原因:各样本均数之间存在差异的原因:1=2=3=4 随机因素引起的差异随机因素引起的差异 1、2、3、4均不等或不全等,均不等或不全等,各总体间可能各总体间可能 存在本质差异,即处理因素有用存在本质差异,即处理因素有用 判断哪一种情况所引起的,统计学采判断哪一种情况所引起的,统计学采用假设检验的方法进行判断。用假设检验的方法进行判断。一、方差分析的基本思想一、方差分析的基本思想89组

25、间变异:即由于处理因素组间变异:即由于处理因素+随机误差的影响随机误差的影响 使得各组肝使得各组肝/体比值均数大小不等。体比值均数大小不等。总变异有以下两个来源:总变异有以下两个来源:组内变异:即由于随机误差的原因使得各组组内变异:即由于随机误差的原因使得各组 内部的肝内部的肝/体比值各不相等;体比值各不相等;F=MS组间组间/MS组内组内一、方差分析的基本思想一、方差分析的基本思想90)()()(XXXXXXiij iijcinjcinjiiijcinjijiiiXXXXXX111122112)()()(变异分解:变异分解:一、方差分析的基本思想一、方差分析的基本思想 三三 种种 变变 异异

26、 总总 变变 异异组组 间间 变变 异异组组 内内 变变 异异kiiisn12)1(NXnXciinjjii2121)()(NXX22)(SS总总-SS组间组间 211()inkijjssxx=21()kiissn xx=92&三种变异之间的关系三种变异之间的关系 SS总总=SS组间组间+SS组内组内 总总=N-1v总总=v组间组间+v组内组内 组间组间=k-1 组内组内=N-K 93构造检验统计量构造检验统计量 如果用均方(即自由度如果用均方(即自由度v v去除离均差平方和的商)去除离均差平方和的商)代替离均差平方和以消除各组样本数不同的影响,则代替离均差平方和以消除各组样本数不同的影响,则

27、方差分析就是用组内均方去除组间均方的商(即方差分析就是用组内均方去除组间均方的商(即F F值)值)与与1 1相比较,若相比较,若F F值接近值接近1 1,则说明各组均数间的差异,则说明各组均数间的差异没有统计学意义,若没有统计学意义,若F F值远大于值远大于1 1,则说明各组均数间,则说明各组均数间的差异有统计学意义。实际应用中检验假设成立条件的差异有统计学意义。实际应用中检验假设成立条件下下F F值大于特定值的概率可通过查阅值大于特定值的概率可通过查阅F F界值表(方差分界值表(方差分析用)获得。析用)获得。94 二、完全随机设计资料的方差分析二、完全随机设计资料的方差分析 完全随机设计(或

28、成组设计),只有一个研完全随机设计(或成组设计),只有一个研究因素,有究因素,有k(k2)个水平(或状态)个水平(或状态)变异的分解:变异的分解:总变异组间变异组内变异总变异组间变异组内变异211inkijijxxcNN变异来源变异来源 SS MS F 组间组间 k-1 SS组间组间/组间组间 MS组间组间/MS组内组内组内组内SS总总-SS组间组间N-k SS组内组内/组内组内总总 N-1211inijkjiixcncxkinjiji112表表9-14 成组设计方差分析的计算公式成组设计方差分析的计算公式96方差分析的步骤方差分析的步骤1.作出假设:作出假设:H0:多个样本总体均数相等。:多

29、个样本总体均数相等。H1:多个样本总体均数不相等或不全等。:多个样本总体均数不相等或不全等。检验水准为。检验水准为。972.计算检验统计量计算检验统计量F值值3650.13216/02.40/)(22NXC8194.2365.1321844.1352CXSS总0276.0365.132428.13439.12474.10461.92222组间SS7918.00276.28194.2组间总组内SSSSSS方差分析的步骤方差分析的步骤98表表9-16 完全随机设计方差分析表完全随机设计方差分析表993.确定确定P值并作出推断结果值并作出推断结果 本例,拒绝本例,拒绝H0,可以认为四组大鼠,可以认为

30、四组大鼠的肝的肝/体比重总体水平不等,但不能体比重总体水平不等,但不能认为任两组间都有差别。认为任两组间都有差别。方差分析的步骤方差分析的步骤100四、平均值之间的多重比较四、平均值之间的多重比较 若用检验,则会增加第一类错误的概率,若用检验,则会增加第一类错误的概率,即可能把本来无差别的两总体均数判为有即可能把本来无差别的两总体均数判为有差别的。差别的。经过方差分析若拒绝了检验假设,只能说经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差若要得到各组均数间更详细的信息,应在方差分析的基础上进行多

31、个样本均数的两两比较。分析的基础上进行多个样本均数的两两比较。101q检验检验(SNK)法法1.样本均数排序样本均数排序2.计算两组均值之差及组间跨度计算两组均值之差及组间跨度a 多个样本均数间的比较的q检验1023.计算统计量计算统计量q:4.计算计算p值,作出统计推断。值,作出统计推断。按按v=12,和,不同组间跨度,和,不同组间跨度a查附表。将上述查附表。将上述计算结果列于下表。计算结果列于下表。q检验检验(SNK)法法)11(2/)(BAeBAnnMSXXq103表表9-20 SNK法两两比较的计算用表法两两比较的计算用表 方方 差差 分分 析析 的的 条条 件件独独 立立 性性正正

32、态态 性性方方 差差 齐齐 性性偏态分布资料不适用方差分析。偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对对偏态分布的资料应考虑用对数变换、平方根变换、倒数变数变换、平方根变换、倒数变换、平方根反正弦变换等变量换、平方根反正弦变换等变量变换方法变为正态或接近正态变换方法变为正态或接近正态后再进行方差分析。后再进行方差分析。若组间方差不齐则不适用方差分若组间方差不齐则不适用方差分析。多个方差的齐性检验可用析。多个方差的齐性检验可用BartlettBartlett法或法或LeveneLevene法。法。任何两个观察值之间均不相关任何两个观察值之间均不相关五、方差分析的假定条件五、方差分析的

33、假定条件 105小 结1.方差分析的基本思想是把全部观察值总方差分析的基本思想是把全部观察值总的变异进行分解,其自由度也相应地分的变异进行分解,其自由度也相应地分解,然后构造检验统计量解,然后构造检验统计量F,根据,根据F分布分布的原理进行检验。的原理进行检验。2.若方差分析发现各总体均数有差别,必若方差分析发现各总体均数有差别,必要时可进一步作两两比较,两两比较时要时可进一步作两两比较,两两比较时可选用可选用q检验。检验。1064 t 检验和检验和u检验检验李红美李红美 讲师讲师苏州大学医学部苏州大学医学部 放射医学与公共卫生学院放射医学与公共卫生学院 流行病与卫生统计教研室流行病与卫生统计

34、教研室 E-mail:第九章第九章 数值变量资料的统计分析数值变量资料的统计分析107概 述1.假设检验的方法是选定的假设检验的方法是选定的 检验统计量而命名的。检验统计量而命名的。2.t检验的应用条件检验的应用条件(1)样本含量较少()样本含量较少(n50););(2)样本来自正态总体,总体方差未知;)样本来自正态总体,总体方差未知;(3)两样本均数比较时还要求两样本的总体方差相等。)两样本均数比较时还要求两样本的总体方差相等。3.u检验的应用条件检验的应用条件样本含量样本含量n较大较大(n 50)或者总体方差或者总体方差 已知。已知。108检验目的:样本均数代表的未知总体均数检验目的:样本

35、均数代表的未知总体均数 和已知总体均数和已知总体均数 0 0的比较。的比较。一、样本均数与总体均数的比较一、样本均数与总体均数的比较 0:已知的理论值或经过大量观察所得到:已知的理论值或经过大量观察所得到 的稳定值。的稳定值。计算公式:计算公式:nsxt/0109实 例 分 析 例例9-15 已知某小样本中已知某小样本中CaCO3含量的含量的真值是。现用某法重复测定该样品真值是。现用某法重复测定该样品15次,次,CaCO3的含量分别的含量分别是:,。是:,。问该法测得的均数与真值有无差别?问该法测得的均数与真值有无差别?110基 本 步 骤00:H1.建立假设,确定检验水准建立假设,确定检验水

36、准01:H1112.计算检验统计量计算检验统计量12.2115/98.316/nxx98.011515)98.316(98.67111)(222nnxxs70.115/98.07.2012.21t基 本 步 骤=15-1=14 1123.确定确定P值,判断结果值,判断结果 查附表查附表9-9 t界值表,得界值表,得t,14。现现t,故,故P 0.05,按的水平,不拒绝按的水平,不拒绝H0,尚不能认为该法测得的均数与真值不同。尚不能认为该法测得的均数与真值不同。基 本 步 骤113二、配对资料的比较二、配对资料的比较配对设计均数假设检验的四种形式:配对设计均数假设检验的四种形式:1.自身比较,即

37、同一受试对象处理前后的比较,以推断自身比较,即同一受试对象处理前后的比较,以推断这种处理有无作用;这种处理有无作用;2.同一对象的两个部位测同一个指标所得结果的比较;同一对象的两个部位测同一个指标所得结果的比较;3.同一样品用两种方法处理结果的比较;同一样品用两种方法处理结果的比较;4.对配对设计的两个受试对象分别给予两种处理的比较。对配对设计的两个受试对象分别给予两种处理的比较。114相对于成组相对于成组t检验而言,如果样本含量检验而言,如果样本含量相同,可提高检验效能;如果检验效相同,可提高检验效能;如果检验效能相同,则可减少样本含量。能相同,则可减少样本含量。优点:优点:公式:公式:1,

38、/0nnsdsdtdd二、配对资料的比较二、配对资料的比较115实 例 分 析 例例9-16 应用某药治疗应用某药治疗8例高血压患者,例高血压患者,观察患者治疗前后舒张压变化情况,如观察患者治疗前后舒张压变化情况,如表表9-10所示,问该药是否对高血压患者所示,问该药是否对高血压患者治疗前后舒张压变化有影响?治疗前后舒张压变化有影响?116患者编号患者编号(1)舒张压舒张压差值差值d (4)=(2)-(1)治疗前治疗前(2)治疗后治疗后(3)1 96 8882 112 10843 108 10264 102 9845 98 100-26 100 9647 106 10248 100 928表表

39、9-10 用某药治疗高血压患者前后舒张压变化情况用某药治疗高血压患者前后舒张压变化情况117基 本 步 骤1.建立假设,确定检验水准建立假设,确定检验水准H0:d=0H1:d01182.计算检验统计量计算检验统计量50.4836ndd16.3188/362322ds02.412.150.48/16.350.4t基 本 步 骤=8-1=7119基 本 步 骤t0.05,7=2.365,4.022.365,p0.10,按水准,不拒绝按水准,不拒绝H0,尚不能认为有差别。尚不能认为有差别。1232.两个小样本均数的比较两个小样本均数的比较2,212121nnsxxtxx)11(2)1()1()11(

40、212122212121221nnnnnsnsnnsscxx三、两个样本均数的比较三、两个样本均数的比较计算公式:计算公式:124例例9-18 两组大白鼠分别饲以高蛋白和低蛋两组大白鼠分别饲以高蛋白和低蛋白饲料,观察实验第白饲料,观察实验第28到到84天体重增加天体重增加情况,资料如下:情况,资料如下:高高134 146 104 119 124 161 107 83113 129 97123低低70118 101 85107 132 941251建立假设,确定检验水准建立假设,确定检验水准 00:H01:H2.计算检验统计量计算检验统计量3.确定确定p值,判断结果值,判断结果 t0.05,17

41、=2.110,1.8910.05,按水准,按水准,不拒绝不拒绝H0。n1=12,1201x17783221x 14401xn2=7,1012x7395922x 7072x05.1021xxs891.105.10101120t=17126四、假设检验应注意的问题四、假设检验应注意的问题1.资料必须合乎随机化抽样原则。资料必须合乎随机化抽样原则。2.选用的假设检验方法应符合检验条件。选用的假设检验方法应符合检验条件。3.实际差别大小与统计学意义的区别。实际差别大小与统计学意义的区别。4.进行假设检验时,对差别有无统计学意进行假设检验时,对差别有无统计学意义的结论不能绝对化。义的结论不能绝对化。5.

42、假设检验的单侧与双侧检验的选择。假设检验的单侧与双侧检验的选择。127I I类错误和类错误和IIII类错误(补充)类错误(补充)拒绝了实际上成立拒绝了实际上成立H0;即即“弃真弃真”。第一类错误第一类错误(I I类错误)类错误)不拒绝实际上不成立的不拒绝实际上不成立的H0;即即“存伪存伪”。第二类错误第二类错误(IIII类错误)类错误)当两总体有差别,按检验水准当两总体有差别,按检验水准 所所能发现该差异的能力。能发现该差异的能力。检验效能检验效能(1 1)128小 结1.假设检验的目的是检验假设检验的目的是检验H0是否成立,本章介绍了是否成立,本章介绍了t、u检验。检验的基本思想是:在检验。检验的基本思想是:在H0 成立的条成立的条件下作随机抽样,按件下作随机抽样,按t 值、值、u值的分布规律,获值的分布规律,获得现有样本统计量的概率得现有样本统计量的概率P,则拒绝,则拒绝H0接受接受H1,这样有可能犯一类错误,其概率为这样有可能犯一类错误,其概率为;若;若P,则不拒绝则不拒绝H0,有可能犯二类错误,其概率为,有可能犯二类错误,其概率为。2.掌握三种形式的掌握三种形式的t检验应用条件及计算公式检验应用条件及计算公式

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!