统计学教案习题02计量资料的统计描述

上传人：liu****han 文档编号：168621384 上传时间：2022-11-11 格式：DOC 页数：22 大小：900KB

收藏版权申诉举报下载

第1页 / 共22页

第2页 / 共22页

第3页 / 共22页

下载文档到电脑，查找使用更方便

10 积分

下载资源

资源描述：

《统计学教案习题02计量资料的统计描述》由会员分享，可在线阅读，更多相关《统计学教案习题02计量资料的统计描述（22页珍藏版）》请在装配图网上搜索。

1、第二章计量资料的统计描述一、教学大纲要求（一）掌握内容1. 频数分布表与频数分布图（1）频数表的编制。（2）频数分布的类型。（3）频数分布表的用途。2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。算术均数、几何均数、中位数。3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。（二）熟悉内容连续型变量的频数分布图：等距分组、不等距分组。二、教学内容精要计量资料又称为测量资料，它是测量每个观察单位某项指标值的大小所得的资料，一般均有计量单位。常用描述定量资料分布规律的统计方法有两种：一类是用统计图表，主要是频数分布表（图）；另一类

2、是选用适当的统计指标。（一）频数分布表的编制频数表（frequency table）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日内死亡 0，1，2，20 个病人的天数。如描述某学校学生性别分布情况，男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。制作连续型数据频数表一般步骤如下：1.求数据的极差（range）。R = Xmax-Xmin（2-1）“组段”数（通常 810 个）。确定组段和组距。每个组段都有下限 L 和上限 U，数据归组统

3、一定为 LU 。3.写出组段，逐一划记。频数表可用于揭示资料的分布特征和分布类型，在文献中常用于陈述资料，它便于发现某些特大或特小的可疑值，也便于进一步计算指标和统计分析处理。（二）描述频数分布中心位置的平均指标描述中心位置的平均指标，但常因资料的不同而选取不同的指标进行描述。算术均数（arithmetic mean）简称均数，描述一组数据在数量上的平均水平。总体均数用表示，样本均数用表示，其计算方法如下：（1）直接法：直接用原始观测值计算。X（2）加权法：在频数表基础上计算，其中XXX =fn 为组中值，为频数。（2-2）X = fX f（2-3）几何均数（geometric mean）

4、用以描述对数正态分布或数据呈倍数变化资料的水平。记为 G。其计算公式为： (1)直接法 n x 25x x ( 3 751 253 1 X - G = lg-1lg X n（2-4）（2）加权法 f lg X G = lg -1 f （2-5）中位数（median）将一组观察值由小到大排列，n 量的平均值。为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变为奇数时为偶数时M =Xn+1 2 1 M = X +X 2 ( )2n( +1)2（2-6）（2-7）2-1 常用平均数的意义及其应用场合平均数均数几何均数中位数意义平均数量水平平均增（减）倍数位次居中的观察值水平应用场合应用甚广，最

5、适用于对称分布，特别是正态分布等比资料；对数正态分布偏态分布；分布不明；分布末端无确定值（一）反映数据变异程度大小的变异指标变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、四分位数间距、方差、标准差和变异系数，尤其是方差和标准差更为常用。极差（range）亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。R = Xmax-Xmin（2-1）（1）百分位数（percentile）是将 n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。百分位数用 P 表示，0 x 100,如

6、 25%位数表示为 P 。在频数表上，百分位数的计算公式为：iP =L + xfxn x% - fL)（2-8）（2）四分位数间距（inter-quartile range）是由第 3 四分位数（Q = P ）和第 1 四分位数（Q = P ）相减计算而得，常与中位数一起使用，描述偏态分布资料的分布特征，比极差稳定。其计算公式：QR =Q-Q(2-9)方差（variance）表示一组数据的平均离散情况，其计算公式为：S2=( m)2n -1(2-10)标准差（standard deviation）是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大样本、小样本均可，最为

7、常用，其计算公式为：S =(X - Xn -1)2= X2( X )n -12n(2-11)变异系数（coefficient of variation）用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用 CV 表示，计算公式为：CV =SX100 %(2-12)平均指标和变异指标分别反映资料的不同特征，作为资料的总结性统计量，两类指标要求一起使用。如常用或 M（QR）。三、典型试题分析1.名词解释：平均数X S答案：平均数（average）是描述数据分布集中趋势的指标，在卫生领域中最常用的平均数指标：算术均数、几何均数和中位数。评析本题考察平均数的概念。平均数是一类统计指标，并

8、不单纯指算术均数。2.描述一组偏态分布资料的变异度，以（）指标较好。答案：D评析标准差和变异系数均用于描述正态分布资料的变异度，全距和四分位数间距可用于任何资料，而四分位数间距更为稳定，故选 D。3.用均数和标准差可以全面描述（）资料的特征。答案：C评析本题考察均数和标准差的应用条件。4.同一资料的标准差是否一定小于均数？答案：均数和标准差是两类不同性质的统计指标。标准差用于描述数据的变异程度，变异程度大，则该值大，变异程度小，则该值小。标准差可大于均数，也可小于均数。5.试述极差、四分位数间距、标准差及变异系数的适用范围。答案：这三个指标均反映计量资料的离散程度。极差与四分位数间距可

9、用于任何分布，后者较前者稳定，但均不能综合反映各观察值的变异程度；标准差最为常用，要求资料近似服从正态分布；变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。四、习题（一）名词解释（二）单项选择题1.各观察值均加（或减）同一数后（）。A.均数不变，标准差改变 B.均数改变，标准差不变2.比较身高和体重两组数据变异度大小宜采用（）。3.以下指标中（）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数4.偏态分布宜用（）描述其分布的集中趋势。C.中位数 D.四分位数间距5.各观察值同乘以一个不等于 0 的常数后，（）不变。A算术均数6.（）分布的资料，均

10、数等于中位数。7.对数正态分布是一种（）分布。C.左偏态 D.右偏态8.最小组段无下限或最大组段无上限的频数分布资料，可用（）描述其集中趋势。9.（）小，表示用该样本均数估计总体均数的可靠性大。C. 标准误10.血清学滴度资料最常用来表示其平均水平的指标是（）。D. 平均数CV 的数值（）。A. 一定大于 1C. 可大于 1，也可小于 112.数列 8、-3、5、0、1、4、-1 的中位数是（）。A. 2 B. 013.关于标准差,那项是错误的（）。D.不会小于算术均数14.中位数描述集中位置时,下面那项是错误的（）。A. 适合于偏态分布资料D.分布末端无确定值时,只能用中位数

11、15. 5 人的血清滴度为 50 ）或总体 s 已知时0u =X -m0S / n（n 较大时）（ 4-5 ）X -mu = （ s 已知时）（4-6 ） s / n05 大样本均数比较的 u 检验前提：样本足够大成组设计的两样本均数比较可用：u =X -X12（4-7 ）S +Sx x1 26 要推断组间没有差别或差别很小，应采用等效检验（ squivalence test ）。( 五)假设检验的步骤及有关概念1 基本思想：把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。2 步骤：建立假设、选用单侧或双侧检验、确定检验水准；选用适当检验方法，计算统计量；确定 P 值并作出推断结

12、论。3 I 类错误：H0为真（实际无差别），假设检验结果拒绝H0，接受H1（推论有差别）所犯的错误称为 I 类错误（ type I error ），I 类错误的概率记作 a。II 类错误： H 为真（实际有差别），假设检验结果拒绝 H ，接受 H （推论无差别）所犯的错误称为 II 类1 1 0错误（ type II error ），II 类错误的概率记作 b 。4 1- b 称为检验效能，过去称把握度（ power of test ），即两总体确有差别，按 a水准能发现该差别的能力。三、典型试题分析（一）单项选择题1 当样本含量增大时，以下说法正确的是（）A. 标准差会变小B. 样均数标

13、准误会变小C. 均数标准误会变大D 标准差会变大答案： B评析本题考点：这道题是考察均数标准误的概念。从均数标准误的定义讲，它反映的是均数抽样误差的大小，那么样本含量越大，抽样误差应该越小。从均数标准误的计算公式 S =S / n 来看，也应是 n 越大， Sxx越小。2区间 XSx的含义是（）A99% 的总体均数在此范围内B 样本均数的 99% 可信区间C99% 的样本均数在此范围内D 总体均数的 99% 可信区间答案： D 评析本题考点：可信区间的含义。可信区间的确切含义指的是：总体参数是固定的，可信区间包含了总体参数的可能性是1 -a，而不是总体参数落在 CI 范围的可能性为 1

14、-a。本题 B 、D 均指样本均数，首先排除。 A 说总体均数在此范围内，显然与可信区间的含义相悖。因此答案为 D。（二）是非题1 进行两均数差别的假设检验时，当 P 0.05 时，则拒绝 H ；当 P0.05 时，则接受 H ，认为两总体均数0 0无差别。评析答案：错误。当 P 0.05 ，拒绝 H 时，我们是依据 a这一小概率来下结论的。而当 P 0.05 时，我们0对两总体均数无差别这一结论无任何概率保证，因此不能贸然下无差别的结论。正确的说法是，按所取检验水准 a ，接受 H 的统计证据不足。12通常单侧检验较双侧检验更为灵敏，更易检验出差别，应此宜广泛使用。评析答案：错

15、误。根据专业知识推断两个总体是否有差别时，是甲高于乙，还是乙高于甲，当两种可能都存在时，一般选双侧；若根据专业知识，如果甲不会低于乙，或者研究者仅关心其中一种可能时，可选用单侧。一般来讲，双侧检验较为稳妥。单侧检验，应以专业知识为依据，它充分利用了另一侧的不可能性，故检出率高，但应慎用。3只要增加样本含量到足够大，就可以避免 I 和 II 型错误。评析答案：错误。因为通过假设检验推断出的结论具有概率性，因此出现错误判断的可能性就一定存在，无论用任何方法也不能消除这一可能。但是，我们可以使错误判断的可能性尽量地小，比如样本含量越大，犯和 II 类错误的可能性越小。（三）简答题1 简

16、述可信区间在假设检验问题中的作用。评析可信区间不仅能回答差别有无统计学意义，而且还能提示差别有无实际意义。可信区间只能在预先规I定的概率即检验水准 a的前提下进行计算，而假设检验能够获得一较为确切的概率 P 值。故将二者结合起来，才2 0 1 是对假设检验问题的完整分析。2某医生就 4-3 资料，对比用胎盘浸液钩端螺旋体菌苗对 328 名农民接种前、后血清抗体的变化。表 4-3 328 名农民血清抗体滴度及统计量020抗体滴度的倒数 40 80 160 320640 1280XSsx免疫前人数免疫后人数2112271619 24 25 1957 76 75 543 025 23t 0）/

17、 25.90 +6.172=12.6 ，按n=14查 t 界值表 P0.01 ，说明接种后血清抗体有增长。问该医生在整理资料和分析资料过程中有何不妥？答：资料整理不当，未整理成配对资料；统计描述指标使用不当，对于滴度的倒数不宜用算术均数、标准差，有“0”出现，也不宜算几何均数。比较免疫前后抗体滴度的倒数，应计算中位数和四分位数间距；不宜用 t 检验。可将抗体滴度的倒数经对数或平方根转换后，做配对 t 检验（ =327 ）。（四）计算题1 某医院用新药与常规药物治疗婴幼儿贫血，将 20 名贫血患儿随机等分两组，分别接受两种药物治疗，测得血红蛋白增加量（ g/L ）见表 4-4 。

18、问新药与常规药的疗效有无差别？表 4-4两种药物治疗婴幼儿贫血结果治疗药物血红蛋白增加量（ g/L ）新药组常规药组24143618252014 26 34 2315 22 24 21202515271923解：本题属成组设计资料。H :0m =m12H :1m m12a=0.05t =X -X1 2Sx -x1 2，n=n +n -21 2t=2.72.6485=1.019，n=18P因此，根据现有资料尚不能认为新药与常规药的疗效有差别。2将 20 名某病患者随机分为两组，分别用甲、乙两药治疗，测得治疗前后的血沉（ mm/h ）见表 4-5 。问：（1 ）甲、乙两药是否均有效？（ 2 ）甲

19、、乙两药疗效是否有别？表 4-5甲、乙两药治疗某病情况甲药乙药序号治疗前治疗后序号治疗前治疗后130261129262332912302332623132925431301433235303015282362724162625728221730288282518312292523193027102923203024（1 ）解：对甲、乙两药治疗数据分别采用配对 t 检验，得甲药： t= d / S =d乙药： t= d / S =dv=9 ，P P 0.1 ，按 a =0.05 水准，不拒绝 H ，尚不能认为甲、乙两药疗效有差别。3 测得某地 90 名正常成年女性红细胞数（ 10 4/mm 3）

20、的均值 418 、标准差为 29 。试求：（1 ）该地 95% 的正常成年女性红细胞数所在的范围；（2 ）该地正常成年女性红细胞数总体均数的 95% 可信区间。解：（1 ）用正态分布法估计正常值范围。因红细胞过多或过少均为异常 ,故此参考值范围应是双侧范围。上限： X S 29=474.84 （10 4/mm 3）下限： XS29=361.16 （10 4/mm 3）。即（ 361.16 ，474.84 ）（10 4/mm 3）。（2 ）由于 n= 9050 ，故可近似为正态分布。上限： X S X29/ 90 =423.99 （ 104/mm 3）下限： X S 29/ 90 =412.

21、01 （10 4 X即（ 412.01 ，423.99 ）（10 4/mm 3 ）。（一）单项选择题1 标准误的英文缩写为：）。/mm 3四、习题AS B SE C SXD SD2 通常可采用以下那种方法来减小抽样误差：A减小样本标准差 C扩大样本含量3 配对设计的目的：B 减小样本含量 D 以上都不对A提高测量精度C为了可以使用 t 检验B 操作方便D 提高组间可比性4 以下关于参数估计的说法正确的是：A 区间估计优于点估计B 样本含量越大，参数估计准确的可能性越大C 样本含量越大，参数估计越精确D 对于一个参数只能有一个估计值5 关于假设检验，下列那一项说法是正确的A单侧检验优于双侧检验B

22、采用配对 t 检验还是成组 t 检验是由实验设计方法决定的 C检验结果若 P 值大于 0.05 ，则接受 H 犯错误的可能性很小 D 用 u 检验进行两样本总体均数比较时，要求方差齐性6.7.两样本比较时，分别取以下检验水准，下列何者所取第二类错误最小 A a=0.05 B a=0.01 C a=0.10 D a统计推断的内容是A用样本指标推断总体指标 CA 、B 均不是B 检验统计上的“假设” D A 、B 均是8 当两总体方差不齐时，以下哪种方法不适用于两样本总体均数比较At 检验Cu 检验（假设是大样本时）B t检验 D F 检验9 甲、乙两人分别从随机数字表抽得 30 个（各取两位数

23、字）随机数字作为两个样本，求得 X ， S ， X ，1 1 2S ，则理论上20 A X1=X2， S21= S22B 作两样本 t 检验，必然得出无差别的结论C作两方差齐性的 F 检验，必然方差齐D 分别由甲、乙两样本求出的总体均数的 95% 可信区间，很可能有重叠 10 以下关于参数点估计的说法正确的是ACV 越小，表示用该样本估计总体均数越可靠B s 越小，表示用该样本估计总体均数越准确XC s 越大，表示用该样本估计总体均数的可靠性越差XD S 越小，表示用该样本估计总体均数越可靠（二）名词解释1 统计推断 2 抽样误差 3 标准误及 sX4 可信区间5 参数估计6 假设检验中 P

24、的含义7 I 型和 II 型错误8 检验效能9 检验水准（三）是非题1若两样本均数比较的假设检验结果 P 值远远小于，则说明差异非常大。2对同一参数的估计， 99% 可信区间比 90% 可信区间好。3均数的标准误越小，则对总体均数的估计越准确。（四）简答题1假设检验时，当 P ，则拒绝 H ，理论依据是什么？2假设检验中 a 与 P 的区别何在？（五）计算题1. 治疗 10 名高血压病人，对每一种病人治疗前、后的舒张压（ mmHg ）进行了测量，结果见（表 4-6 ），问治疗前后有无差异？表 4-6 10 名高血压病人治疗前后的舒张压（ mmHg ）病例编号治疗前治疗后11171232

25、127108314112041071075110100611498711510281381529127104101221072 某医院病理科研究人体两肾的重量， 20 例男性尸解时的左、右肾的称重记录见表 4-7 ，问左、右肾重量有无不同？表 4-7 20 例男性尸解时左、右肾的称重记录编号12345678左肾（克） 170155140115235125130145右肾（克） 1501451051002221151201050 0 0 9101112131415161718192010514515511014014512013010595100105125135150125150140901

26、20100100901253有 13 例健康人，11 例克山病人的血磷测定值（mg%）如表 4-8 所示，问克山病人的血磷是否高于健康人？表 4-8健康人与克山病人的血磷测定值（ mg% ）健康人患者17015015512514015011514023590125120130100145100105901451252 某生化实验室测定了几组人的血清甘油三酯含量（ mg% ）见表 4-9 ，试分析比较工人与干部，男与女的该项血酯水平。表 4-9正常成人按不同职业、性别分类的的血清甘油三酯含量（ mg% ）工人干部男女人数平均数112106116102五、习题答题要点标准差（一）单项选择题

27、1 .B 2.C 3.D 4.B 5.B 6.D 7.（二）名词解释1 统计推断：通过样本指标来说明总体特征，这种从样本获取有关总体信息的过程称为统计推断（ statistical inference ）。2 抽样误差：由个体变异产生的，抽样造成的样本统计量与总体参数的差异，称为抽样误差（ sampling error ）。3 标准误及 s ：通常将样本统计量的标准差称为标准误。许多样本均数的标准差Xs 称为均数的标准误 X（standard error of mean ，SEM ），它反映了样本均数间的离散程度，也反映了样本均数与总体均数的差异，说明均数抽样误差的大小。4 可信区间：

28、按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间（confidence interval ，CI ）。它的确切含义是：可信区间包含总体参数的可能性是 1- a ，而不是总体参数落在该范围的可能性为 1- a 。5 参数估计：指用样本指标值（统计量）估计总体指标值（参数）。参数估计有两种方法：点估计和区间估计。6 假设检验中 P 的含义：指从 H 规定的总体随机抽得等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。7 I 型和 II 型错误：I 型错误（type I error ），指拒绝了实际上成立的 H ，这类“弃真”的错误称为 I 型错误，其

29、概率大小用 a表示；II 型错误（ type II error ），指接受了实际上不成立的 H ，这类“存伪”的误称为 II 型错误，其概率大小用 b表示。8 检验效能：1- b称为检验效能（ power of test ），它是指当两总体确有差别，按规定的检验水准 a所能发现0 0 1 0 0 0 0 0该差异的能力。9 检验水准：，是预先规定的，当假设检验结果拒绝 H ，接受 H ，下“有差别”的结论时犯错误的概率称为检验水准（ level of a test ），记为 a。（三）是非题1 错。 P 值的大小只能说明差异是否有统计学意义，同样的差异，例数越多， P 值越小。2 错。可

30、信区间的优劣要通过两点衡量：区间的可信度；区间的宽度。因此不能笼统的通过区间可信度的大小来评价优劣。3 正确。标准误越小，可信区间越窄，对总体均数估计的准确程度越高。（四）简答题1 答： P 值系由 H 所规定的总体做随机抽样，获得等于及大于（或等于及小于）依据现有样本信息所计算得的检验统计量的概率。当 P 时，说明在 H 成立的条件下，得到现有检验结果的概率小于 a，因为小概率事件几乎不可能在一次试验中发生，所以拒绝 H 。同时，下“有差别”的结论的同时，我们能够知道可能犯错误的概率不会大于是说，有了概率保证。a，也就2答：以 t 检验为例， a与 P 都可用 t 分布尾部面积大小表

31、示，所不同的是： a值是指在统计推断时预先设定的一个小概率值，就是说如果 H 是真的，允许它错误的被拒绝的概率。 P 值是由实际样本获得的，是指在 H0成立的前提下，出现等于或大于现有检验统计量的概率。0（五）计算题1 解：本题属配对设计资料，故应用配对 t 检验方法计算。 t=2.484 ，v= 9 ，P，按 aH ，认为治疗前后有差别（注：此类研究是非随机的自身前后对比研究，要确认疗效，应设立平行对照）。2解：本题属配对设计资料，故应用配对 t 检验方法计算。 t=2.157 ，v=19 ，P ，按 a H ，认为左、右肾重量差别有统计学意义，右较左肾轻。3解：本题属成组设计资料，

32、故应用成组 t 检验方法计算。 t=2.539 ，v=22 ，P，按 a H ，认为二者血磷含量0差别有统计学意义，克山病人的血磷高于健康人。（注：此类研究是非随机化的对比研究，如果病人与健康人不具可比性，如居住地不同、性别不同、年龄不同，则不能保证结论正确。4解：本题可通过计算两均数差值的 95% 或 99% 可信区间来判断两总体均数的差别。工人与干部均数差值的 95% 和 99% 可信区间分别为：（，），（，），均不包含 0 在内，故可认为工人与干部血清甘油三酯含量的总体均属有差别。男性与女性均数差值的 95% 和 99% 可信区间分别为：（，），（，），均包含 0 在内，故尚不能认为男性与女性血清甘油三酯含量的总体均属有差别。（潘晓平马跃渊）

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

统计学教案习题02计量资料的统计描述

最新文档

相关资源

相关搜索