卫生统计学赵耐青习题问题详解

上传人:痛*** 文档编号:110168265 上传时间:2022-06-17 格式:DOC 页数:77 大小:243.50KB
收藏 版权申诉 举报 下载
卫生统计学赵耐青习题问题详解_第1页
第1页 / 共77页
卫生统计学赵耐青习题问题详解_第2页
第2页 / 共77页
卫生统计学赵耐青习题问题详解_第3页
第3页 / 共77页
资源描述:

《卫生统计学赵耐青习题问题详解》由会员分享,可在线阅读,更多相关《卫生统计学赵耐青习题问题详解(77页珍藏版)》请在装配图网上搜索。

1、word习题答案第一章一、是非题1. 家庭中子女数是离散型的定量变量。答:对。2. 同质个体之间的变异称为个体变异。答:对。3. 学校对某个课程进行1 次考试,可以理解为对学生掌握该课程知识的一次随机抽样。答:对。4. 某医生用某个新药治疗了100 名牛皮癣患者,其中55 个人有效,则该药的有效率为55%。答:错。只能说该样本有效率为55或称用此药总体有效率的样本估计值为55%。5.已知在某个人群中,糖尿病的患病率为8%,则可以认为在该人群中,随机抽一个对象,其患糖尿病的概率为8%。答:对,人群的患病率称为总体患病率。在该人群中随机抽取一个对象,每个对象均有相同的机会被抽中,抽到是糖尿病患者的

2、概率为8。二、选择题1. 下列属于连续型变量的是A 。A 血压B 职业C 性别D 民族2. 某高校欲了解大学新生心理健康状况,随机选取了1000 例大学新生调查,这1000 例大学生新生调查问卷是A 。A 一份随机样本B 研究总体C 目标总体D 个体3. 某研究用X 表示儿童在一年中患感冒的次数,共收集了1000 人,请问:儿童在一年中患感冒次数的资料属于C 。A 连续型资料B 有序分类资料C 不具有分类的离散型资料D 以上均不对4. 下列描述中,不正确的是D 。A 总体中的个体具有同质性B 总体中的个体小异C 总体中的个体在同质的基础上有变异D 如果个体间有变异那它们肯定不是来自同一总体5用

3、某个降糖药物对糖尿病患者进行治疗,根据某个大规模随机抽样调查的研究结果得到该药的降糖有效率为85%的结论,请问降糖有效率是指D 。A 每治疗100 个糖尿病患者,正好有85 个人降糖有效,15 个人降糖无效B 每个接受该药物治疗的糖尿病患者,降糖有效的机会为85%C 接受该药物治疗的糖尿病人群中,降糖有效的比例为85%D 根据该研究的入选标准所规定的糖尿病患者人群中,估计该药降糖有效的比例为85%三、简答题1. 某医生收治200 名患者,随机分成2 组,每组100 人。一组用A 药,另一组用B 药。经过2 个月的治疗,A 药组治愈了90 人,B 组治愈了85 名患者,请根据现有结果评议下列说法

4、是否正确,为什么?a)A 药组的疗效高于B 药组。b)A 药的疗效高于B 药。答:a)正确,因为就两组样本而言,的确A 组疗效高于B 组。b) 不正确,因为样本的结果存在抽样误差,因此有可能人群的A 药疗效高于B 药,也可能人群的两药的疗效相同甚至人群B 药的疗效高于A 药,2. 某校同一年级的A 班和B 班用同一试卷进行一次数学测验。经过盲态改卷后,公布成绩:A 班的平均成绩为80 分,B 班的平均成绩为81 分,请评议下列说法是否正确,为什么?a)可以称A 班的这次考试的平均成绩低于B 班,不存在抽样误差。b)可以称A 班的数学平均水平低于B 班。答:a) 正确,因为此处将A 班和B 班作

5、为研究总体,故不存在抽样误差。b)不正确,因为这一次数学平均成绩只是两班数学成绩总体中的两个样本,样本的差异可能仅仅由抽样误差造成。3. 在某个治疗儿童哮喘的激素喷雾剂新药的临床试验中,研究者收集了300 名哮喘儿童患者,随机分为试验组和对照组,试验组在哮喘缓解期采用激素喷雾剂,在哮喘发作期采用激素喷雾剂扩展气管药;对照组在哮喘缓解期不使用任何药物,在哮喘发作期采用扩展气管药物。通过治疗3 个月,以肺功能检查中的第1 秒用力呼吸率(FEV1/FRC1)作为主要有效性评价指标,评价两种治疗方案的有效性和安全性。请阐述这个研究中的总体和总体均数是什么?答:试验组的研究总体是接受试验组治疗方案的全体

6、哮喘儿童患者在治疗3 个月时的FEV1/FRC1 值的全体。对照组的研究总体是接受对照组治疗方案的全体哮喘儿童患者在治疗3 个月时的FEV1/FRC1 值的全体。试验组对应的总体均数是接受试验组治疗方案的全体哮喘儿童患者在治疗3 个月时的FEV1/FRC1 的平均值;对照组对应的总体均数是接受对照组治疗方案的全体哮喘儿童患者在治疗3 个月时的FEV1/FRC1 的平均值。4. 请简述什么是小概率事件?对于一次随机抽样,能否认为小概率事件是不可能发生的?答:在统计学中,如果随机事件发生的概率小于或等于0.05,则通常可以认为是一个小概率事件,表示该事件在大多数情况下不会发生,并且一般可以认为小概

7、率事件在一次随机抽样中不会发生,这就是小概率事件原理。小概率事件原理是统计学检验的基础。5. 变量的类型有哪几种?请举例说明,各有什么特点?答:(1)连续型变量,可以一个区间中任意取值的变量,即在忽略测量精度的情况下,连续型变量在理论上可以取到区间中的任意一个值,并且通常含有测量单位。观察连续型变量所得到的数据资料称为计量资料(measurement data)。如例1-1 中的身高变量就是连续型变量,身高资料为计量资料。.(2)离散型变量,变量的取值围是有限个值或者为一个数列。离散型变量的取值情况可以分为具有分类性质的资料和不具有分类性质的资料,表示分类情况的离散型变量亦称分类变量(cate

8、gorical variable)。观察分类变量所得到的资料称为分类资料(categorical data)。分类资料可以分为二分类资料和多分类资料,而多分类资料又分成无序分类资料和有序分类资料,二分类资料如症状指标分为感染或未感染,无序多分类资料(nominal data) 如血型可以分为A、B、AB 和O 型,有序多分类资料(ordinal data) 如病情指标分为无症状、轻度、中度和重度。第二章一、是非题1不论数据呈何种分布,都可以用算术均数和中位数表示其平均水平。答:错。只有资料满足正态或近似正态分布时计算算术均数是比较有统计学意义的。2在一组变量值中少数几个变量值比大多数变量值大几

9、百倍,一般不宜用算术均数表示其平均水平。答:对,可以采用中位数表示。3只要单位相同,用s 和用CV 来表示两组资料的离散程度,结论是完全一样的。答:错,标准差S 是绝对误差的一种度量,变异系数CV 是相对误差的一种度量,对于两组资料离散程度的比较,即使两组资料的度量单位相同,也完全有可能出现两个指标的结论是不同的。在实际应用时,选择离散程度的指标时,考虑其结果是否有研究背景意义。例如:一组资料为成人的身高观察值,另一组资料为2 岁幼儿的身高观察值,虽然可以用标准差S比较两组的离散程度,也不能认为这是错误的,但根本没有研究背景意义,相反选择变异系数CV 比较两组资料的相对变异程度,这就有一定的研

10、究背景意义。4描述200 人血压的分布,应绘制频数图。答:对。5. 算术均数与中位数均不容易受极值的影响。答:错。算术均数比中位数容易受到极值的影响。二、选择题1中位数是表示变量值A 的指标。A平均水平B变化围C频数分布D相互间差别大小2对于最小组段无确定下限值和(或)最大组段无确定上限值的频数分布表资料,宜用下列哪些指标进行统计描述?C _A 中位数,极差B 中位数,四分位数间距C 中位数,四分位数围D 中位数,标准差3描述年龄(分8 组)与疗效(有效率)的关系,应绘制A 。A线图B. 圆图C. 直方图D. 百分条图4、为了描述资料分布概况,绘制直方图时,直方图的纵轴可以为D 。A 频数B

11、频率C 频率密度(频率/组距) D 都可以三、简答与分析题1100 名健康成年女子血清总蛋白含量(g/L)如表2-14,试描述之。表2-12 100 名成年健康女子血清总蛋白含量(g/L)答:制作频数表如下:_组段频数百分比累积频数累积百分比_变量例数均数标准差最小值最大值中位数25 百分位数75 百分位数2某医师测得300 名正常人尿汞值(ng/L)如表2-15,试描述资料。表2-13 300 名正常人尿汞值(ng/L)尿汞例数累计例数累计百分数(%)合计300 答:根据资料给出统计描述的指标如下:例数均数标准差最小值最大值16 15.053 49.014 2 62对于同一的非负样本资料,其

12、算数均数一定大于等于几何均数。答:根据初等数学中的不等式1 21 2n nna a a a a an+ + +􀀢􀀢,可以得到算数均数一定大于等于几何均数。常用的描述集中趋势的指标有哪些,并简述其适用条件。答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C资料分布不明。第三章一、是非题1. 二项

13、分布越接近Poisson 分布时,也越接近正态分布。答:错。当二项分布的不太接近0或者1,随着的增大,n和n(1)均较大时,二项分布的X 的逐渐近似正态分布;n 较大,较小,二项分布的X 近似总体均数为= n的Poisson 分布,只有n较大、较小并且n较大时,二项分布的X 既近似Poisson 分布又近似正态分布,其本质是当n 较大、较小时二项分布的X 所近似的Poisson 分布在其总体均数= n较大时逼近正态分布。2. 从同一新生儿总体(无限总体)中随机抽样200 人,其中新生儿窒息人数服从二项分布。答:对。因为可以假定每个新生发生窒息的概率是相同的并且相互独立,对于随机抽取200 人,

14、新生儿窒息人数X 服从二项分布B(n,)。3. 在n 趋向无穷大、总体比例趋向于0,且n保持常数时的二项分布的极限分布是Poisson 分布。答:对。这是二项分布的性质。4. 某一放射物体,以一分钟为单位的放射性计数为50,40,30,30,10,如果以5 分钟为时间单位,其标准差为1605 。答:错。设i X 服从总体均数为的Poisson 分布,i = 1,2,3,4,5,并且相互独立。根据Poisson 分布的可加性,1 2 3 4 5 X + X + X + X + X 服从总体均数为5,_其总体方差为5,本题5 分钟的总体方差5的估计值为50 + 40 + 30 + 30 +10 =

15、 160,所以其标准差为160 。5. 一个放射性物体一分钟脉冲数为20 次,另一个放射性物体一分钟脉冲数为50 次。假定两种放射性物体的脉冲性质相同,并且两种放射性物体发生脉冲是相互独立的,则这两种物体混合后,其一分钟脉冲数的总体均数估计值为70 次。答:对。根据Poisson 分布的可加性,这两种物体混合后的发生的脉冲数为1 2 X + X ,混合后一分钟脉冲数的总体均数估计值为20+5070 次。6. 一个放射性物体平均每分钟脉冲数为5 次(可以认为服从Poisson 分布),用X 表示连续观察20 分钟的脉冲数,则X 也服从Poisson 分布。答:对,这是Poisson 分布的可加性

16、。7. 一个放射性物体平均每分钟脉冲数为5 次(可以认为服从Poisson 分布),用X 表示连续观察20 分钟的脉冲数,则X 的总体均数和总体方差均为100 次。答:对。Poisson 分布的可加性原理。8. 用X 表示某个放射性物体的每分钟脉冲数,其平均每分钟脉冲数为5 次(可以认为服从Poisson 分布),用Y 表示连续观察20 分钟的脉冲数,则可以认为Y 近似服从正态分布,但不能认为X 近似服从正态分布。答:对。因为Y 的总体均数为100,当比较小的时候,Poisson 分布是一个偏态的分布,但是当增大时,Poisson 分布会逐渐趋于对称。二、选择题1. 理论上,二项分布是一种B。

17、A 连续性分布B 离散分布C 均匀分布D 标准正态分布2. 在样本例数不变的情况下,下列何种情况时,二项分布越接近对称分布。CA 总体率越大B 样本率P 越大C 总体率越接近0.5 D 总体率越小3. 医学上认为人的尿氟浓度以偏高为不正常,若正常人的尿氟浓度X 呈对数正态分布,Y = lgX , G 为X 的几何均数,尿氟浓度的95%参考值围的界值计算公式是A 。A lg 1( 1.64 ) Y Y + S B + 1.96 X G S C + 1.64 X G S D lg 1( 1.96 ) Y Y + S4. 设1 2 10 X , X ,􀀢, X 均服从B(4,0.0

18、1) ,并且1 2 10 X , X ,􀀢, X 相互独立。令1 2 10 Y = X + X +􀀢+ X ,则DA Y 近似服从二项分布B Y 近似服从Poisson 分布C Y 近似服从正态分布D Y B(40,0.01)5. 设1 2 10 X , X ,􀀢, X 均服从Poisson(2.2) ,并且1 2 10 X , X ,􀀢, X 相互独立。令1 2 10 Y = (X + X +􀀢+ X ) /10,则CA Y 近似服从B(10,0.22) B Y 服从Poisson(22)分布C Y 近

19、似服从正态分布D Y 服从Poisson(2.2)分布三、简答题1. 如果X 的总体均数为,总体标准差为,令Y a+bX,则可以证明:Y 的总体均数为a+b,标准差为b。如果X 服从40 的Poisson 分布,请问:Y = X /2 的总体均数和标准差是多少?答:总体均数=20,总体标准差= 40 / 2。2. 设X 服从40 的Poisson 分布,请问:Y = X /2 是否服从Poisson 分布?为什么?答:不是的。因为Y = X /2 的总体均数=20,不等于总体方差10。3. 设X 服从40 的Poisson 分布,可以认为X 近似服从正态分布。令Y = X /10,试问:是否可

20、以认为Y 也近似服从正态分布?答:正态分布的随机变量乘以一个非0 常数仍服从正态分布,所以可以认为Y 也近似服从正态分布。4. 设X 服从均数为的 Poisson 分布。请利用两个概率之比:P(X +1) / P(X ),证明:当x 时,概率P(X )随着X 增大而减小。答:1( 1)/( ) ( )/ /( 1)( 1)! !x xP X x P X x e e xx x+= + = = = +, 显然,当x 1 时,对应x +1 +,所以P(X = x +1) / P(X = x) 1,说明概率P(X ) 随着X 增大而增加;当X 时,则( 1)/( ) 11P X x P X xx x=

21、 + = = 时,概率P(X )随着X 增大而减小。5. 已知某饮用水的合格标准是每升水的大肠杆菌数2 个,如果随机抽取1 升饮用水,检测出大肠杆菌数的95参考值围是多少?(提示考虑合格标准的总体均数最大值为2 个/L,求95参考值围)。答:由于合格标准的总体均数最大值为2 个/L,对于正常而言,大肠杆菌数越少越好,所以这是单侧参考值围。即求满足累计概率的不等式20 0!X X kk kP k ek= = =的最大X 的解。X 0 1 2 3 4 5 6P(X ) 0( )XkP k= 根据上述计算得到 X 的95参考值围是X 5个/L。?第四章一、是非题1、设X 的总体均数为,则样本均数X

22、的总体均数也为。答:对。经随机抽样得到的样本均数X 的总体均数也为。2、设X 的总体方差为2,则样本均数X 的总体方差也为2。答:错。经随机抽样后得到的样本均数X 的总体方差为2/n。3、设随机变量1, , n X X 均服从B(1,) ,n 很大时,则11 niiX Xn = 近似服从N(,(1) / n)答:对。4、某研究者做了一个儿童血铅浓度的流行病学调查,共调查了1000 人,检测了每个人血铅浓度。虽然血铅检浓度一般呈非正态分布,但由于该研究样本量很大,可以认为这些血铅浓度近似服从正态分布。答:错。血铅浓度的分布与样本量是否很大无关,如果样本量充分大时,血铅浓度的样本均数的分布近似正态

23、分布。5、某研究者做了一个儿童血铅浓度的流行病学调查,共调查了1000 人,检测了每个人血铅浓度,计算这1000 人的血铅平均浓度。对于现有的1000 人的血铅浓度资料,可以认为该资料的样本均数近似服从正态分布。答:错。样本均数的概率分布是指随机抽样前将要随机抽取的样本,其样本均数近似服从某个概率分布,样本量很大时,样本均数逼近正态分布。对于这个资料而言,这是已经完成随机抽样的资料,这个资料的样本均数只是一个数,不存在服从哪种分布的问题。6、某研究者做了一个儿童血铅浓度的流行病学调查,已知血铅测量值非正态分布,计划调查1000 人,并将计算1000 人的血铅浓度的样本均数,由于该研究样本量很大

24、,可以认为随机抽样所获得血铅浓度的样本均数将近似服从正态分布。答:对。如果从某个均数为,标准差为的非正态分布的总体中抽样,只要样本量足够大,则样本均数X 的分布也将近似于正态分布N(,2 / n)。二、选择题1、以下方法中唯一可行的减小抽样误差的方法是_B_。A、减少个体变异 B、增加样本量C、设立对照 D、严格贯彻随机抽样的原则2、X S 表示_C_。A、总体均数的离散程度B、总体标准差的离散程度C、样本均数的离散程度D、样本标准差的离散程度3、设连续性随机变量X的总体均数为,从X总体中反复随机抽样,随样本量n 增大,XXS将趋于_D_。A、X 的原始分布B、正态分布C、均数的抽样分布D、标

25、准正态分布4、在均数为,标准差为的正态总体中随机抽样,理论上| X |_B_的可能性为5%。B 1.96 X C、0.05/ 2,v t S D 1.96 X S5、下面关于标准误的四种说法中,哪一种是不正确_C_。A、标准误是样本统计量的标准差B、标准误反映了样本统计量的变异C、标准误反映了总体参数的变异D、标准误反映了抽样误差的大小6、变量X 偏离正态分布,只要样本量足够大,样本均数_C_。A、偏离正态分布B、服从F 分布C、近似正态分布D、服从t 分布三、简答题1、样本均数的抽样误差定义是什么?答:样本均数的抽样误差是指样本均数和总体均数间的差异,但同时可以表现为从同一总体中多次随机抽样

26、所得的样本均数间的差异,通常用样本均数的标准误度量平均的抽样误差大小。2、估计样本均数的平均抽样误差的统计量是什么?答:是样本均数的标准差,即样本均数的标准误。3、简述样本均数的抽样误差的规律?。答:样本均数的标准误的理论值为x n= ,而其估计值为XS Sn= ;4、简述t 分布、F 分布,2 分布曲线的特征与自由度的关系。答:t 分布是一簇以0 为中心,左右对称的单峰曲线,随着自由度的增加,t 分布曲线将越来越接近于标准正态分布曲线,当自由度为无穷大时,t 分布就是标准正态分布。t 分布的曲线下两侧尾部的面积可以通过查对应自由度下的t 分布界值表得到。2 分布的图形为一簇单峰正偏态分布曲线

27、,且随着自由度的增加,正偏的程度越来越小。2 分布的曲线下右侧尾部的面积可通过查2 界值表得到。F 分布的特征有:(1)F 分布有两个自由度,F 的取值围为0。(2)F 分布为一簇单峰正偏态分布曲线,与两个自由度有关。(3)每一对自由度下的F 分布曲线下面积,见方差分析用F 界值表(附表4),横标目为第一自由度,纵标目为第二自由度,表中分别给出了概率为0.05 和0.01 时的F 界值,记为, 1 , 2 F。t 分布,2 分布和F 分布是三种没有未知参数,只有自由度的概率分布,常用于抽样研究中,故称为三种常见的抽样分布。5、简述正态分布、t 分布、F 分布、2 分布之间的关系。答:(1)若随

28、机变量X 服从于正态分布N (,2 ),那么从总体中随机抽取的样本,其样本均数X 将服从于正态分布( , 2 ) X N 。令Z 为对X 进行标准化变换的结果,Z 将服从于标准正态分布,即X /Z X Xn= = 服从标准正态分布。(2)自由度为1 的2 分布可以通过将服从标准正态分布的变量平方得到。(3)若随机变量X1 和X2 分别为服从自由度为v1和v2 的2 分布,并且相互独立,则比值1 )21 1 122 2 2 /F XX= = 分布(分布( 2 )/服从自由度为(v1,v2)的F 分布(F-distribution)。6、目前一般的统计软件(如SAS,SPSS 和Stata)均能随

29、机模拟产生服从均匀分布、正态分布、二项分布的随机数。利用这些程序,可以生成指定参数下的随机数据,这种产生随机数的方法称为“蒙特卡洛方法”(Monte-Carlo Method)。请参考光盘中随机模拟操作,借助统计软件随机模拟产生随机数据,重现本章中关于均数和率的抽样分布规律。答:以Stata 为例正态分布资料的样本均数的分布模拟。用记事本写入下来语句clearset memory 100mdi 输入样本量总体均数总体标准差scalar m=1scalar mm=2scalar oo=3set obs 10000local j=1gen xx=0gen ss=0while j=mgen xj=i

30、nvnorm(uniform()*oo+mmreplace xx=xx+xjreplace ss=ss+xj*xjlocal j=j+1gen ssd=sqrt(ss-xx*xx/m)/(m-1)replace xx=xx/mdi mean= xxdi sd= ssd用文件名simumean.do保存在Stata 窗口中打入do 路径simumean 样本量总体均数总体标准差对于Stata 7.0,输入下列命令显示样本均数的频数图graph xx,bin(50) xlabel对于Stata 8.0,输入下列命令显示样本均数的频数图graph7 xx,bin(50) xlabel非正态分布的样本

31、均数的分布模拟。用记事本写入下来语句clearset memory 100mdi 输入样本量scalar m=1set obs 10000local j=1gen xx=0gen ss=0while j=mgen xj=invnorm(uniform()2replace xx=xx+xjreplace ss=ss+xj*xjlocal j=j+1gen ssd=sqrt(ss-xx*xx/m)/(m-1)replace xx=xx/mdi mean= xxdi sd= ssd用文件名simumean1.do保存在Stata 窗口中打入do 路径simumean1 样本量总体均数总体标准差对于S

32、tata 7.0,输入下列命令显示样本均数的频数图graph xx,bin(50) xlabel显示原始资料的频数分布图graph x1,bin(50) xlabel对于Stata 8.0,输入下列命令显示样本均数的频数图graph7 xx,bin(50) xlabel显示原始资料的频数分布图graph7 x1,bin(50) xlabel样本率的分布模拟。用记事本写入下来语句clearset memory 100mdi 输入样本量总体率scalar m=1scalar pp=2set obs 10000local j=1gen xx=0gen ss=0while j=mreplace xx=

33、xx+int(uniform()+pp)local j=j+1gen ppp=xx/msu ppp用文件名simumean3.do保存在Stata 窗口中打入do 路径simumean3 样本量总体率对于Stata 7.0,输入下列命令显示样本率的频数图graph ppp,bin(50) xlabel对于Stata 8.0,输入下列命令显示样本率的频数图graph7 ppp,bin(50) xlabel7、利用蒙特卡洛方法,产生标准正态分布的随机数,并计算样本方差,验证方差乘自由度(n 1)S2服从于自由度为n 1的2 分布,两个独立样本的方差之比服从于自由度为1 n 1,2 n 1的F 分布

34、。答:标准正态分布资料的样本方差(n1)的分布模拟。用记事本写入下来语句clearset memory 100mdi 输入样本量scalar m=1set obs 10000local j=1gen xx=0gen ss=0while j=mgen xj=invnorm(uniform()replace xx=xx+xjreplace ss=ss+xj*xjlocal j=j+1gen ss= ss-xx*xx/m用文件名simuvariance.do保存在Stata 窗口中打入do 路径 simuvariance.do 样本量对于Stata 7.0,输入下列命令显示样本均数的频数图graph

35、 ss,bin(50) xlabel对于Stata 8.0,输入下列命令显示样本均数的频数图graph7 ss,bin(50) xlabelF 分布的模拟。用记事本写入下来语句clearset memory 100mdi 输入样本量1 总体均数1 样本量2 总体均数2 总体标准差scalar m1=1local mn1=1scalar mm1=2scalar m2=3scalar mm2=4scalar oo=5set obs 10000local j=1gen xx=0gen ss=0gen xx0=0while j=m1replace xx0=invnorm(uniform()*oo+m1

36、replace xx=xx+xx0replace ss=ss+xx0*xx0local j=j+1gen ss1= (ss-xx*xx/m1)/(m1-1)replace ss=0replace xx=0local j=1while j 的_概率为1。答:对。当1 H 为真时,作出正确推断的概率即为1。4. 对于0 0 1 0 H := H :的t检验,0 H 为真而言,发生拒绝0 H 的机会与样本量n 无关。答:对。无论样本量n 多大,犯第一类错误的概率为。5. 对于定量资料用95%可信区间的公式0.05/ 2,n 1 X X t S估计总体均数所在围,要求资料服从正态分布或样本量很大。答:

37、对。二选择题1在同一总体随机抽样,其他条件不变,样本量越大,则总体均数的95%可信区间(A )。A 越窄B 越宽C 越可靠D 越稳定2从两个不同总体中随机抽样,样本含量相同,则两总体均数95可信区间(D )。A 标准差小者,可信度大B 标准差小者,准确度高C 标准差小者,可信度大且准确度高D 两者的可信度相同3其他条件不变,可信度1-越大,则总体均数可信区间(A )A 越宽B 越窄C不变D还与第二类错误有关4其他条件不变,可信度1-越大,则随机抽样所获得的总体均数可信区间将不包含总体均数的概率(B )。A 越大B 越小C 不变D 不确定5. 区间包含总体均数的概率为(D )。A 95B 97.

38、5C 99D 1006 从某正态总体中随机抽样,样本含量固定,区间包含样本均数的概率为(A )。A 95B 97.5C 99D 不确定7增大样本含量,则错误的是(A )。A 可信区间的可信度变大B x S 变小C 同样可信度情况下,可信区间变窄D 抽样误差减少8下列公式中,哪一个可以用于正态分布总体均数的95%可信区间的估计(C )。A X B 1.96 X C 0.05(v) X X t S D 0.05(v) X t S9由两个独立样本计算得到两个总体均数的可信区间,则下列结论中正确的是(C )。A 如果两个可信区间无重叠,可认为两样本均数差别无统计意义B 如果两个可信区间有重叠,可认为两

39、样本均数差别有统计意义C 如果两个可信区间无重叠,可认为两样本均数差别有统计意义D 以上都不对10在总体方差相等的条件下,由两个独立样本计算两个总体均数之差的可信区间包含了0,则(B )。A 可认为两样本均数差别无统计学意义B 可认为两样本均数差别有统计学意义C 可认为两总体均数差别无统计学意义D 可认为两总体均数差别有统计学意义11假设检验中的第二类错误是指(D )所犯的错误。1.96 X 1.96 X A 拒绝了实际上成立的H0 B 未拒绝实际上成立的H0C 拒绝了实际上不成立的H0 D 未拒绝实际上不成立的H012. 两样本均数比较的假设检验中,差别有统计学意义时,P 越小,说明(D )

40、。A. 两样本均数差别越大B. 两总体均数差别越大C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同13作两样本均数差别的t 检验中,P 值与值中(A )。A值是研究者指定的BP 值是研究者指定的C两者意义相同,数值不同D两者意义相同,数值相同14. 两样本均数的t 检验,按0.05 的检验水准拒绝H0,若此时推断有误,其错误的概率为(A )。A 0.05 B 0.05 C 0.05 D 不一定15.在样本均数与总体均数差别的双侧显著性检验中,结果为P时,虽然不能拒绝H0,但不能推断H0成立。(提示:假设检验是基于反证法的思想)。答:假设检验是基于反证法的思想。拒绝H0是因为在H

41、0为真的假设下样本统计量出现在小概率事件围,所以可以推断H0非真;反之,在H0为真的假设下样本统计量未出现在小概率事件围,只是没有足够证据支持不能拒绝H0。正如反证法只是寻找推翻假设的证据,并不是寻找支持假设的证据,不能推翻假设的结果并不能成为证实假设成立的证据。事实上,不拒绝H0 时犯第二类错误的概率有时还很大,并且无法由研究者直接控制,所以不拒绝H0 时,不能直接推断H0 成立。2. 下面是18 例冠心病患者高密度脂蛋白(HDL,g/L)的测定结果,请回答下列问题。0.30,0.43,0.26,0.34,0.57,0.49,0.35,0.22,0.33,0.37,0.28,0.35,1)本

42、题所研究的总体是什么?答:满足者该研究中入选标准的全部冠心病患的高密度脂蛋白(HDL,g/L)实际值的全体构成的集合。2)根据本题的研究背景和研究问题,请用研究背景语言给出本题总体均数的具体定义。答:满足者该研究中入选标准的全部冠心病患的高密度脂蛋白(HDL,g/L)实际值的平均数。3)试估计本题的总体均数及其95%可信区间,并用通俗的研究背景语言论述您的结果。答:X = 0.3589, 0.08567, 18, 0.08567 / 18 0.02 X S = n = S = = ,95%可信区间为:x X t s 0.05,17 0.02=(0.3167, 0.4011)。以95可信度推断冠

43、心病患者人群的高密度脂蛋白(HDL,g/L)的平均数在0.31670.4011 g/L。3. 已知大肠杆菌在饮用水中呈Poisson 分布,根据有关规定:对于合格的饮用水而言,平均每升饮用水中的大肠杆菌个数不超过2 个,先在某饮用水生产处抽样2L 水,经检测发现6 个大肠杆菌,请估计该处的饮用水平均1L 中的大肠杆菌数在什么围?答:X=6,查Poisson 分布总体均数的可信区间界值表得,95%的可信区间为(2.20/2, 13.06/2)=(1.10,6.53)。4. 续第3 题,在实际的卫生监督执法中,一般不进行统计分析,但需要根据统计学原理和饮用水卫生标准,指定一个饮用水大肠杆菌数的界值

44、:随机抽取1L 水,当检测到的细菌数低于这个界值,可以推断该处饮用水的平均1L 水的大肠杆菌数不会超过2 个,请以95的可信度确定这个界值。答:= 2,查Poisson 分布总体均数的95可信区间界值表得到大于2 的最小下限为X=6,其95%可信区间为(2.2,13.1),而X=5 的95可信区间为(1.6,11.7),所以当检测结果为大肠杆菌数6 时,可以推断该处饮用水的平均每升水的大肠杆菌数 2,即该饮用水不合格。5. 续第3 题和第4 题,请推敲下列描述有何不同,适用于何种情况?1) 每1L 饮用水中的平均大肠杆菌个数不超过2 个是合格的2)合格的饮用水中,1L 饮用水的大肠杆菌个数不得

45、高于于2 个3)第3 题中,能否按1L 水检测到3 个大肠杆菌估计该处的饮用水平均每每1L 中的大肠杆菌数在什么围,为什么?答:第一个问题是对于合格的饮用水而言,平均每1L 饮用水的大肠杆菌个数不超过2(2),也就是在检测样品为1 升饮用水时,容许样品中的大肠杆菌数超过2 个。第二个问题是指检测样品为1 升水时,不容许样品中的大肠杆菌数超过2个。(X 2)3)根据Poisson 分布的95可信区间推断该处的饮用水平均每升中的大肠杆菌数在(0.62,8.8)第六章一、是非题1. 随机区组设计的检验效能一定高于完全随机设计答:错。如果在完全随机设计中,实验条件和实验过程控制都非常好,研究对象的同质

46、性非常好,几乎不存在可能的混杂因素,即可以认为可能混杂效应很小甚至可以忽略,则完全随机设计的检验效能可能要高于随机区组设计。2. 随机对照试验就是实验性研究答:对。随机对照试验的英文名是Random control trial,缩写为RCT。在随机分组前,随机对照试验的研究对象来自同一人群,通过选择不同的干预,构成试验组和对照组,由此评价干预效应。因此随机对照试验就是实验性研究,但要注意:实验性研究未必是随机对照试验。3. 随机对照试验就是完全随机设计答:错。随机对照试验贯彻了随机化原则,对照组和实验组间除实验因素不同外,其他条件基本相同,研究设计可以是完全随机对照设计,也可以是随机区组设计。

47、4. 采取随机分组可以提高检验效能答:错。采取随机分组的主要目的是控制或减少混杂因素对结果的影响,与检验效能没有直接的连续。5. 为了研究A 因素与死亡的关系,采用队列研究,但所获样本资料不能估计人群的A 因素暴露比例。答:对。因为队列研究是根据A 因素的不同暴露水平分别入选研究对象,由此建立不同暴露水平的队列进行随访研究的。如按A 因素暴露和非暴露分别入组2000 人进行随访,因此暴露人数与非暴露人数是1:1,与人群中的暴露比例无关。即:队列研究中的研究对象中的暴露比例是人为确定的,不是人群的暴露比例。二、选择题1. 病例对照研究的主要缺点之一是 CA. 研究周期长 B. 病例不容易收集C.

48、 容易产生选择性偏倚 D. 容易失访2. 病例对照研究的主要优点之一是 CA. 容易失访 B. 不容易发生测量偏倚C. 患病率很低的疾病也适用 D. 很容易选择和收集对照3. 病例对照研究最好应选择 D 为对照A. 健康人 B. 医院中未患该疾病的人C. 医院中的正常人 D. 根据研究背景选择符合一定条件的未患该疾病的人4.采用配对设计的主要目的是 B 。A 减少样本含量 B 减少混杂因素对结果的影响C 提高统计检验的功效 D 有利于统计分析5. 下列说法哪一个是正确的。A. 采用完全随机设计可以使试验组和对照组同时减少混杂因素的影响B. 采用随机区组设计可以控制了混杂因素对结果的影响C. 采

49、用随机区组设计可以减少了混杂因素对结果的影响,当效应指标与研究因素之间存在混杂效应的情况下,采用配对设计可以提高了统计检验的效能。D. 采用完全随机设计可以控制混杂因素在试验组和对照组达到概率意义下的平衡,由此提高了统计检验的效能。三、简答题1. 实验性研究和观察性研究的根本区别是什么?答:主要区别在于是否人为给予干预措施,如果研究者人为施加了干预措施那么就是实验性研究,如果研究者没有施加干预措施,而是以客观、真实的观察为依据,对观察结果进行描述和对比分析,那么就是观察性研究。另外在干预前,实验性研究的研究对象来自同一群体;比较性质的观察性研究的对象一般来自不同人群。2. 实验设计的三个基本原

50、则是什么?答:实验设计的基本原则:对照、随机、重复。设立对照和贯彻随机化是使各组均衡可比的两个非常重要的手段。重复就是指试验组和对照组需要满足一定的样本量。3. 随机化的作用是什么?答:随机化是采用随机的方式,使每个受试对象都有同等的机会被抽取或分到不同的实验组和对照组。随机化使不可控制的混杂因素在实验组和对照组中的影响较为均匀,并可归于实验误差之中;它也是对资料进行统计推断的前提,各种统计分析方法都是建立在随机化的基础上。4. 为比较两种药物对小鼠移植性肉瘤生长有无抑制作用的效果,如果由文献报道,小鼠肿瘤重量的标准差在0.7g 左右而小鼠肿瘤重量测量的有效精度在0.5g 左右,规定此检验分辨

51、的能力 = 0.5 g,标准差S = 0.7 g,= 0.05,Z=0.20,试估计每组所需样本量?如何将小鼠分组?并写出分组结果。答:每组样本量估计2 2 2 22 22( ) 2(1.96 0.842) 0.7 31n Z Z+ += = =考虑到可能存在一定的脱落,增加 20样本量,故每组样本量取n 31 = 38。随机分组方案如下:将76 只小鼠编号:1,2,76。设置种子数200(可以任意设置一个数值作为种子数)借助Stata 软件产生76 个在(0,1)上均匀分布的随机数,每个随机数对应一个研究对象:小鼠。对76 个随机数从小到大排序,最小的38 个随机数对应的小鼠编号为试验组,最

52、大的38 个随机数对应的小鼠编号为对照组。借助Stata 软件实现如下:set obs 76 设置观察记录数为76gen id=_n 产生编号176set seed 200 设置种子数200gen r=uniform() 产生随机数sort r 对随机数进行排序gen group=1-int(_n-1)/38) 设置最小的38 个随机数为group=1,其它为group=0sort id 按编号排序list id group 列出随机分组第七章一、是非题1. 在两样本t 检验中,t 检验统计量服从自由度为n1+n2-2 的t 分布。答:错,只有H0 :1 = 2为真才成立2. 对于两个样本的样

53、本量都很大时,t 检验对正态性的要求可以忽略。答:对,根据中心极限定理可知,样本量很大时,样本均数的分布逼近正态分布。3. 对于两个样本的样本量都很大时,t 检验对方差齐性的要求可以忽略。答:不对,方差齐性与样本量大小无关。4. 对于观察单位不一致的两样本Poisson 分布资料的平均水平检验,要求两个样本的均数1 X ,2 X 均大于30。答:不对,只要求在原始观察单位的情况下,原始观察值均大于30,详细见本章基本概念辩析。5. 在假设检验中,当拒绝H0 时,还可能存在第二类错误。答:不对,犯第一类错只可能发生在拒绝H0 时,犯第二类错误只可能发生在不拒绝H0 时。所以当拒绝H0 时,就不可能存在第二类错误。二、选择题:1. 两个样本均数不一致,t 检验时P0.05,则(C )2. 两独立样本均数的比较,P20,可以推断Poisson 分布的总体均数 20,并且可以认为Y 近似服从正态分布,根据正态分布的随机变量乘以一个非0 常数仍旧服从正态分布的原理,所以可以认为X = Y /10近似服从正态分布。三、简答题:1某医院用新药与常规药物治疗婴幼儿贫血,将20 名贫血患儿随机分为两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)如下表,请回答下列问题:1) 新药与常规药的疗效有无差别

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!