医学统计学历年考题及答案

上传人:痛*** 文档编号:112685538 上传时间:2022-06-23 格式:DOC 页数:11 大小:375KB
收藏 版权申诉 举报 下载
医学统计学历年考题及答案_第1页
第1页 / 共11页
医学统计学历年考题及答案_第2页
第2页 / 共11页
医学统计学历年考题及答案_第3页
第3页 / 共11页
资源描述:

《医学统计学历年考题及答案》由会员分享,可在线阅读,更多相关《医学统计学历年考题及答案(11页珍藏版)》请在装配图网上搜索。

1、试题2010-01-05/#大学/医学院/2009级/研究生/医学统计简答1 给了一张表,计算患病率,发病率,病死率,以与患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等2 一个单向有序资料分组变量无序,指标变量有序,用了卡方检验,问你对不对?为什么?如果是你,用什么?3 假设检验的基本思想和原则4 给了多元线性回归的资料列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值,判断哪个方程回归效果最好,为什么?5 给了甲流的例子,用某药治疗,用了自身对照用药前后抗体浓度变化为指标,得出了药物有效.问你合不合理,为什么?你的设计是什么?6一型错误和二型错误的区别和联系7什么是抽样

2、误差?举例说明分类资料和数量资料的抽样误差计算1 给了健康人的白天和晚上血压的相关数值x和y各自的平均数,和,平方和,以与两者差值的均数等注:计算时直接带入公式的相关数值1比较白天晚上血压有无差别2白天和晚上血压有无相关3如何用白天血压估计晚上血压2 多个平均值进行总体假设检验.类如几种药的作用效果是否相同方差分析也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分3 样本率与总体率的比较 也有人说:配伍组方差分析20081. 列出样本标准误的估计值的公式,至少五个包括两样本差值的标准误,两样本率差值的标准误等2. 医学统计中,将正态分布视为近似

3、正态分布有哪几种情况?列出应用条件和公式3. 数值资料的统计描述指标?公式?4. 多元回归模型的基本形式?参数含义?回归效果的评价?5. 什么叫截尾值?产生原因?举例说明6. 一同学两样本率的比较 用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议?7. 一个三因素的2X2X2的析因设计的实验设计与分析思路8. 给了一个数值资料:小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值小鼠的体重增加量也有十个值1 对体重增加量资料进行统计描述2 求饮食量和体重增加量的关系3 由体重增加量的

4、样本估计其代表总体均数的可信区间4 求小鼠体重增加量为X5就是从体重增加量的那十个値里取了一个的95%的置信区间5 3和4中的可信区间有什么差别?20061直线回归中的b与多元线性回归中的B有什么区别?多元线性回归中,是否可以用B来表示各自变量对因变量的影响?为什么?2数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路3统计分析中P.a,B以与1-B的意义4给了一个单向有序资料,统计效应是有序的,他用了t检验,问你对不对,为什么?应该用什么统计方法,并写出统计思路5有一个两样本的秩和检验的应用题,写思路,不要求计算6生存分析中,有哪些非参数检验的

5、方法?两个生存率的比较用什么检验?7给了一个实验,测量抗体.样本序列 抗体滴度 效应 是否有效1 1:40 + 是2 1:160 + 是.就是几个表格,让你给每个列个表,并且应该用哪些指标来描述.8正态分布,二项分布,poisson分布的可信区间 9有两个变量,让你说出分析它们相关的统计分析思路10有个析因设计的题,让你写出检验的思路,好象是还要写出公式.2005研究生1. 举例说明变量与变量类型.10分答案:变量:在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量.如身高、体重、疗效等变量按其性质可分为两种类型:1数值变量:其变量值是定

6、量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位.如身高cm、体重kg、心律次/min、血压mmHg等.2分类变量:表现为互不相容的类别或属性,它又分为无序与有序两类:a.无序分类变量:是指所分类别或属性之间无程度或顺序上的差别,如:性别男、女血型A、B、O、AB等.b.有序分类变量:是指所分类别或属性之间有程度或顺序上的差别.如尿糖化验结果按-、+-、+、+、+分类,疗效按治愈、好转、无效、恶化分组.2. 在假设检验过程中,若设定a为0.05,算得统计量后,得p值为0.015,按a=0.05的检验水准拒绝无效假设.请对这一结论做出适当的评论,并为此写例假设检验中p值

7、的含义,以与p与a的关系.10分答案:P值为0.015小于检验水准a0.05,依据小概率事件在一次随机试验中认为不可能发生的定理,拒绝H0,接受H1,尚可以认为现有样本所代表的总体与已知总体不相等.P值的含义是指从H0所规定的总体中随机抽样时,获得等于与大于负值为等于与小于现有样本统计量的概率.若pa,按a检验水准不拒绝H0,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的.若p=a,依据小概率事件在一次随机试验中认为不可能发生的定理,拒绝H0,接受H1;可认为从已知总体中抽到现有样本的可能性很小,该样本可能来自另一总体.3. 写出数值变量资料中完全随机设计的多个样本比较的统计分析

8、思路不必写出计算公式.15分答案:1统计描述:描述资料的类型:数值变量资料频数表资料的分布:正态性检验服从正态分布:均数、标准差方差;不服从正态分布,服从对数正态分布:几何均数、几何标准差;偏态分布:中位数、四分位数间距2统计推断:资料的设计类型:完全随机设计的多个样本比较分布:正态性检验和方差齐性检验:1如果样本服从正态分布且方差齐,就用完全随机设计的多个样本的方差分析来作统计推断;2如果样本不服从正态分布或者方差不齐,经变量变换转换为正态分布方差齐,再用方差分析推断;3如果变量变换不能使样本服从正态分布且方差齐,就用秩和检验来做统计推断.4. 写出两变量之间相关关系的分析思路.15分答案:

9、1绘制散点图:在直角坐标系内绘制散点图,看两变量之间有没有线性趋势,如果有就做相关分析.如果两变量都服从双变量正态分布,则做直线相关分析;如果不服从线性模型条件要求即不服从或总体未知的资料,则作Spearman等级相关分析.或者进行曲线拟合.2计算直线相关系数r或者Spearman秩相关系数rs.3对相关系数作假设检验,由于抽样误差的存在,即使从p=0的总体中做随机抽样误差,所得的R值也不一定等于零,应对样本相关系数做假设检验.根据检验目的,检验假设为:H0:P=0;H1=/0.常用t检验 v=n-2,拒绝H0认为两变量间存在直线相关.4总体相关系数的可信区间估计,先对相关系数做Z变换,估计Z

10、的可信区间,其分布服从正态分布原理,按正态分布原理1001-a%可信区间,再对Z的可信区间上下限按r=tanh z进行逆变换.5.请利用下面的随机数字表将15只小白鼠完全随机的分配到甲、乙、丙3个实验组中,使各组例数相等.要求写出随机分配方案.10分随机数字表部分数据编号 1-10 11-20 21-30 31-40 41-50 1 22 17 68 65 81 68 95 23 92 35 87 02 22 57 51 61 09 43 95 06 58 24 82 03 47 2 19 36 27 59 46 13 79 93 37 55 39 77 32 77 09 85 52 05 3

11、0 62 47 83 51 62 74 3 16 77 23 02 77 09 61 87 25 21 28 06 24 25 93 16 71 13 59 78 23 05 47 47 25 4 78 43 76 71 61 20 44 90 32 64 97 67 63 99 61 46 38 03 93 22 69 81 21 99 21 5 03 28 28 26 08 73 37 32 04 05 69 30 16 09 05 88 69 58 28 99 35 07 44 75 47答案:先把十五只动物按体重从小到大分别编号:1 2 3 4 5 6 7 8 9 10 11 12 1

12、3 14 15;在随机数字表任意指定某行某列,如取第三行的1列开始,向下录入不重复的二位随机数字:16 77 23 02 09 61 87 25 21 28 06 24 93 71 13;对应于十五只动物的编号,对随机数字有小到大编秩得出序号R如下:5 13 7 1 3 11 14 9 6 10 2 8 15 12 4;并规定:一到五号分到甲试验组,六到十号分到乙组,十一到十五号分到丙组;随机分配结果是:甲实验组动物有:1 4 5 11 15;乙组动物为:3 8 9 10 12 ;丙组动物有:2 6 7 13 14.6. 某试验需在5%和15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙三

13、种药物对K562细胞进行抑制.此研究宜用何种试验设计,并写出设计方案;若每种实验条件下各观察4个独立的样品,共需多少样品即样本含量?10分答案:此研究宜用析因试验设计,析因设计是一种多因素多水平交叉分组进行全面试验的设计方法,可以研究两个或两个以上因素多个水平的效应,也可以检验各因素间的交互作用;因本试验中有2个试验因素,即氧浓度和药物,一个因素有2个水平,另一个因素有3个水平,而且氧浓度和药物之间可能存在交互作用;因此选用析因试验设计.设计方案:该试验是一个2X3的析因设计,共有2X3=6个试验组,用a1表示5%的氧浓度,a2表示15%的氧浓度;用b1表示甲药物.b2表示乙药物,b3表示丙药

14、物. 先按随机分组的原则,将试验动物按随机化原则分配到各组,各组先进行不同试验因素的处理,间隔一段时间后,再把各组之间的处理方法交换,并统计处理的结果.分析两因素之间有无交互作用与其交互作用的性质.同时分析两个因素各个水平之间的效应来评价对细胞的抑制作用.样本含量:2X3X4=247. 某研究者随机测定了某地100例健康成人血清NSE酶ug/l含量,请你充分利用该资料所能提供的信息,写出全面的分析思路.20分答案:1资料的类型,列频数表,观察分布类型和分布特征:经判断资料为数值变量资料,对该资料作正态性检验,如果资料服从正态分布,进行统计描述,用均数、标准差方差来描述资料;不服从正态分布,进行

15、变量变换使其服从正态分布,若是服从对数正态分布,用几何均数、几何标准差来描述资料;若资料服从偏态分布,则用中位数、四分位数间距对资料进行统计描述.统计描述:2通过资料来估计制定医学参考值范围:比如估计该地健康成年人血清NSE酶含量的上双侧95%90%、99%参考值范围,如果资料为正态分布资料,则95%医学参考值范围为;如果资料为对数正态分布资料,则95%医学参考值范围为Xlgx-1.96,Xlgx +1.96;如果资料为偏态分布,则95%医学参考值范围为.3统计推断:参数估计包括均数的抽样误差即标准误:和总体均数的可信区间估计未知且n较小:可信区间为;未知但n足够大:;已知:.8. 多元回归方

16、程为:yhat=b0+b1x1+b2x2+bjxj+bpxp,其中bj的名称是什么,它的意义是什么?若比较各自变量对因变量影响的大小,应通过什么统计量比较?判断多元线性回归分析的效果应看那些指标?10分答案:bj称为偏回归系数,意义是在其他自变量固定不变的条件下,自变量xi每改变一个单位时所引起的因变量y的平均改变量.比较各自变量对因变量影响的大小,应通过bj的大小来比较.常用的多元线形回归分析的效果指标有决定系数R2是回归平方和占总平方和的比例,值越大,回归效果越好、复相关系数决定系数的算术平方根,反应应变量和自变量线性组合见得相关关系的密切程度R越就接近1,线性关系越密切、校正决定系数越大

17、回归效果越好、剩余标准差不能有m个自变量的变化解释的Y的变异,越小回归效果越好等.2001级七年制临床医学专业考试试题答案1、同质:对研究指标影响较大的、可以控制得主要因素尽可能相同.变异:同质基础上各观察单位的某变量值得差异称为变异.2、均数的抽样误差:由抽样研究造成的样本均数与总体均数间的差异称为均数的抽样误差.3、假设检验P值含义:P值是指从所规定得总体中随机抽样时,获得等于与大负值时为等于与小于现有样本统计量的概率.若,按检验水准不拒绝,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的.若,依据小概率事件在一次随机试验中认为不可能发生的定理,拒绝,接受;可认为从已知总体抽到

18、现有样本得可能性很小,该样本可能来自另一总体.4、变量与其变量类型:变量:在搜集资料时,对每个观察单位得某项特征进行测量或观察,该特征称为变量.变量类型:1.数值变量其变量值是定量的,表现为数值得大小,通常用仪器或某种尺度测定出来,多有度量衡单位.由数值变量的测定值组成的资料称为数值变量资料或计数资料.如:身高、体重、心律、住院天数、血压等.2.分类变量亦称定性变量,表现为互不相容的类别或属性.分类变量可分为无序与有序两类:1无序分类分类是指所分类别或属性之间无程序或顺序上的差别.分析无序分类变量时,应先按类别分组,计各组的观察单位数,所得资料称为无序分类变量资料或计数资料.如:性别男、女,血

19、型O、A、B、AB等.2有序分类变量是指所分类别或属性之间无程序或顺序上的差别.分析有序分类变量时,应先按等级顺序分组,计各组的观察单位数,所得资料称为有序分类变量资料或等级资料.如:尿糖化验结果按、分类,疗效按治愈、好转、无效、恶化分组.二、标准差:计算公式:(1) 表示观察值的变异程度(2) 计算变异系数(3) 确定医学参考值范围(4) 计算标准误(5) 与样本含量没有关系标准误:计算公式:(1) 估计均数的抽样误差的大小(2) 估计总体均数可信区间 :(3) 进行假设检验(4) 与样本含量成反比三、1、t分布,均数的区间估计:1未知且n小:2未知,但n足够大时n100,t分布逼近u分布:

20、3已知:2、二项分布:当样本含量n足够大,且样本率p或1-p均不太小,如np与n1-p均大于5时,样本率p的抽样分布近似正态分布,总体率的可信区间:3、Poisson分布:当样本阳性数X50时,可按正态近似原理先求总体平均数的95%或99%可信区间:四、方差分析的应用条件:1各样本是相互独立的随机样本;2个样本来自正态分布总体;3各总体方差相等,即方差齐.应用:1两个或多个样本的均数间的比较;2分析两个或多个因素间的交互作用;3回归方程的线性假设检验;4多元线性回归分析中偏回归系数的假设检验等.五、该设计是2*4析因设计设计方案如下,如图所示,可将八个样品随机分为下面的八组:A1A2A3A4B

21、1A1B1A2B1A3B1A4B1B2A1B2A2B2A3B2A4B2先为八个样品按取样先后标上1、2、3、4、5、6、7、8,再用随机数字表将其标上随机数字,随机数字表略去将随机数字排秩,按秩次的1到8,分别取从A1B1、.进行实验.六、先将受试对象编号,再利用随机列表或随机数字表或计算机软件产生的随机数字,按某一行将受试对象编上随机数字,然后将其随机数字编秩,秩次为奇数的分为一组,秩次为偶数的分为一组进行实验.这就是完全随机设计两样本比较的分析思路.其检验统计量值是:,七、非条件logisti回归模型:,其中是常数项,为偏回归系数.2002级临床医学七年制医学统计学期末考试题A卷一、试述标

22、准差与标准误的联系与区别.二、请以完全随机设计资料为例说明方差分析的基本思想.三、在某次假设检验中,0.05,所得的概率为0.001,请就本例分别说明和的意义?四、研究人员调查了20#某社区全部居民的全死因死亡与恶性肿瘤死亡人数见表1,根据该资料可以得出哪些统计信息? 10分表1 某社区居民20#死亡人口调查年龄人口数全死因死亡人数恶性肿瘤死亡人数08292013842046639631240281611724260937034232合计16709071590五、请解释多元线性回归分析中R2和的统计学意义.六、什么是随访资料中的截尾值?出现截尾值的原因有哪些?七、中国人民解放军总后卫生部军需装

23、备研究所研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉用评分表示,且需要进行全搭配实验,应采用何种设计?需安排几个实验组?请写出设计方案.八、今测得101名3049岁的正常成年男子的血清总胆固醇表2.试根据此资料进行全面的统计分析.10分血清胆固醇频数2.5 13.0 83.5 94.0 234.5 255.0 175.5 96.0 66.5 2 7.07.5 1合 计101九、为了比较工人和农民的高血压患病率,随机调查了5059岁的男性工人1281人,其中高血压患者386人;又随机调查了5059岁的男性农民387人,其中高血压患者65人.问工人与农民的高血压患病率是否相同?

24、十、今测得10名男20岁男青年的身高与前臂长表3,问二者有无线性相关关系,若有相关关系,其相关关系的密切程度与方向如何.10分表3 10名男20岁男青年的身高与前臂长编号 1 2 3 4 5 6 7 8 9 10身高170173160155173188178183180165前臂长 45 42 44 41 47 50 47 46 49 43可能用到的界值:, , .2002级临床医学七年制医学统计学期末考试试题A参考答案一、试述标准差与标准误的区别和联系答:区别: 意义:标准差是描述数据分布离散程度的指标;标准误是样本统计量的标准差.公式:;2分用途:标准差用于表示数据离散程度的大小;也可用于

25、计算变异系数、估计频数分布、制定参考值范围、进行质量控制;很多统计处理方法中要用到标准差. 标准误用于反映抽样误差的大小;计算总体均数的可信区间;统计处理方法的基础,如t检验._标准误与标准差成正比;若标准差固定不变,可通过增加样本含量来减少抽样误差.二、请以完全随机设计为例说明方差分析的基本思想答:方差分析的基本思想就是把全部观察值间的变异-总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小.在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异:分解为和;分解为和,得组间变异和组内变异分别为=和=,若各组的来自同一总体,则各组间的变

26、异与组内变异一样,均由随机误差所致,=,F值服从F分布,查F界值表得到相应的P值,然后根据所取的检验水准做出推断结论.答案难以统一,只要基本意思表达正确,均应给分,阅卷时需灵活掌握,注意把握尺度.三、在某次假设检验中,检验水准为0.05,所得的概率为0.001,请就本例分别说明和的意义? 答:称检验水准,是预先给定的概率值,它确定了小概率事件的标准;P的含义是指从规定的总体随机抽得等于与大于或等于与小于现有样本获得的检验统计量值的概率,即抽样误差的概率.将获得的概率P与检验水准进行比较可得出结论.本例0.05,0.0010.05,拒绝,接受,结论具有统计学意义,可以认为不同或不等.四、研究人员

27、调查了20#某社区全部居民的全死因死亡与恶性肿瘤死亡人数见表1,根据该资料可以得出哪些统计信息?答:可以得到以下统计信息:各年龄组人口构成比、各年龄组全死因构成比、恶性肿瘤死因构成比和各年龄组恶性肿瘤死亡构成比、粗死亡率和年龄别死亡率、恶性肿瘤死亡率和年龄别恶性肿瘤死亡率.不要求:肿瘤后的死亡人数占全死因死亡人数的比例、全死因寿命表死亡概率、全死因寿命表生存概率、去肿瘤死亡后的生存概率、去肿瘤死亡后的尚存人数、去肿瘤死亡后的死亡人数、去肿瘤死亡后的生存人年数、去肿瘤死亡后的生存总人年数、去肿瘤死亡后各年龄尚存者的平均预期寿命.五、请解释多元线性回归分析中R2和的统计学意义.答:R2为决定系数,

28、其意义是回归平方和占总离均差平方和的比例,用R2可定量评价在的总变异中,由变量组建立的线性回归方程所能解释的比例.为剩余标准差,可以说明估计值的精确度,剩余标准差越小,表示回归方程的估计精度越高.六、什么是随访资料中的截尾值?出现的原因有哪些?答:由于某种原因使得部分病人不能随访到底,称之为截尾,从起点至截尾点所经历的时间称为截尾值.出现截尾值的原因主要有随访对象失访、治疗措施改变、研究工作结束时事件尚未发生等情况.七、研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉用评分表示,且需要进行全搭配实验,应采用何种设计?需安排几个实验组?请写出设计方案.答:应采用22析因设计,需安

29、排4个实验组.具体设计方案如下:状态1状态2环境11 2 3 4 51 2 3 4 5环境21 2 3 4 51 2 3 4 5八、今测得101名3049岁正常成年男子的血清总胆固醇表2.据此资料进行全面的统计分析.10分答:由频数表可看出,资料近似服从正态分布,可用均数和标准差描述其集中趋势和离散趋势.,制定95%参考值范围:估计总体均数的可信区间:n=10150九、为了比较工人和农民的高血压患病率,随机调查了5059岁的男性工人1281人,其中高血压患者386人;又随机调查了5059岁的男性农民387人,其中高血压患者65人.问工人与农民的高血压患病率是否相同?答:首先将资料整理成下表形式

30、:是否患高血压是否合计工人3868951281农民65322387合计451121716681建立检验假设,确定检验水准工人与农民的高血压患病率相同工人与农民的高血压患病率不同2选定检验方法,计算检验统计量可选用下列两种方法之一:1检验: 2u检验:确定P值,作出推断结论,或,所以P0.05.拒绝,接受,可以认为工人和农民的高血压患病率不同.十、今测得10名男20岁男青年的身高与前臂长表3,问二者有无线性相关关系,若有相关关系,其相关关系的密切程度与方向如何.10分作散点图略求相关系数, , 相关系数的假设检验两变量间无线性相关关系两变量间有线性相关关系所以P 0.05,拒绝,接受,可以认为两

31、变量间存在线性相关关系,并且呈正相关,即身高越长,前臂长越长.2002级临床医学七年制医学统计学期末考试题B卷一、 试述t分布与u分布的联系与区别.二、 请以完全随机设计资料为例说明方差分析的基本思想.三、 什么是假设检验的检验效能?其大小与哪些因素有关系?四、某医师对一组高血压病人在治疗过程中作追踪观察,记录其死因,并与未作治疗的高血压病人组作比较,两组死因构成比见表1.有人据此提出:高血压患者经过治疗虽然可以降低充血性心力衰竭等的病死率,但却使因冠状动脉硬化性心脏病和心脏病猝死的死亡危险性增加了.这样的认识是否正确,为什么?死 亡 原 因治疗组未治疗组充血性心力衰竭4.323.2脑血管病2

32、3.239.6尿毒症9.812.2冠状动脉病和心脏病猝死48.717.1其它原因14.07.9合 计100.0100.0五、请分别解释Logistic回归模型和Cox回归模型中偏回归系数的意义.六、生存时间资料有哪些特点?生存分析常用的分析方法有哪些?七、某研究室人员为研究5个不同剂量的甲状腺提取液对豚鼠甲状腺重的影响,考虑到豚鼠的种系和体重对观测指标可能有一定的影响,选用5个种系的豚鼠作实验,并按5个不同的体重标准选择受试对象,根据专业知识得知,药液、豚鼠种系、体重之间不存在交互作用.本研究应采用何种设计类型?共需多少只豚鼠?请写出实验设计方案.八、今测得101名3049岁的正常成年男子的血

33、清总胆固醇表2.试根据此资料进行全面的统计分析.10分血清胆固醇频数2.5 13.0 83.5 94.0 234.5 255.0 175.5 96.0 66.5 2 7.07.5 1合 计101九、某医院收集了305例手术患者的资料,其中手术时间5小时者242人,感染者13人;手术时间5小时者63人,感染者7人.试据此分析手术时间长短对患者切口感染是否有影响?十、某地10名一年级女大学生的胸围cm与肺活量L数据如表3所示,试进行直线回归分析.10分学生编号12345678910胸围X72.583.978.388.477.181.778.374.873.779.4肺活量Y2.513.111.91

34、3.282.832.863.161.912.983.28可能有用到的界值:, , .方差分析用F界值: 2002级临床医学七年制医学统计学期末考试试题参考答案B卷一、试述t分布与u分布的异同与联系 答:相同点: t分布与u分布均为以0为中心的单峰对称分布. 不同点:1t分布是一个分布族,t曲线的形状与自由度有关,自由度越小,t值越分散,曲线越低平;自由度越大,t值越往中间集中,曲线峰值越高.而u分布即标准正态分布的图形,是唯一的一条曲线. 2特定自由度的t分布曲线与u分布曲线相比,峰值低而尾部高翘,相应区间内曲线下的面积小于u分布. _t分布的极限形式是u分布.随着自由度的增加,t分布逐渐接近

35、u分布,当自由度n时,t分布u分布.二、请以完全随机设计为例说明方差分析的基本思想 答:方差分析的基本思想就是把全部观察值间的变异-总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小.在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异:分解为和;分解为和,得组间变异和组内变异分别为=和=,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误差所致,=,F值服从F分布,查F界值表得到相应的P值,然后根据所取的检验水准做出推断结论.三、什么是检验效能?其大小与哪些因素有关? 答:检验效能是指,在假设检验中,当无效假设H0不正确

36、时,用现有统计方法能够检验出其错误的能力,其概率用1-b表示.其中b为犯第二类错误即当H0不正确但不拒绝H0的概率.检验效能的大小与设定的检验水准a、样本含量n、两总体参数的差值d 有关.其它条件一定时,a越大,检验效能越高;样本量n越大,检验效能越高;两总体参数的差值d越大,检验效能越高.反之,检验效能越低.五、请分别解释Logistic回归模型和Cox回归模型中偏回归系数的意义.答:Logistic 回归模型中的偏回归系数bi的意义为,当其它协变量均不变时,xi每变化一个单位或一个等级时, 比数比的自然对数 平均变化bi 个单位,可以反映xi对结局事件的作用强度.Cox 回归模型中的偏回归

37、系数bi的意义为,当其它协变量均不变时,xi每变化一个单位或一个等级时, 相对危险度的自然对数 平均变化bi 个单位,可以反映xi对结局事件的作用强度.八、答:由频数表可以看出,资料近似服从正态分布,可以用均数和标准差描述其集中趋势和离散趋势., 制定95%参考值范围:估计总体均数的可信区间九、答:首先将资料整理成下表形式:手术时间是否感染是否合计5小时132292425小时75663合计202853051建立检验假设,确定检验水准两组患者总体感染率相同两组患者总体感染率不同2选定检验方法,计算检验统计量可用两法之一:1检验: 2u检验:确定P值,作出推断结论,或,所以P0.05.按的检验水准

38、, 不拒绝,尚不能认为手术时间长短对患者切口感染有影响.十、答:作散点图,散点图呈直线趋势.求回归方程, , , 故回归方程为.回归方程的假设检验两变量间无线性关系两变量间有线性关系, , .所以P 0.05,不拒绝,尚不能认为两变量间存在线性关系.三、 常用的抽样分布与参数与其参数的区间估计1 数值变量资料的n分布和t分布总体均数u的95%可信区间为一,未知且n小时,按t分布原理计算:二,未知,但n足够大时,t分布逼近u分布:三,已知时,按u分布原理计算2 分类变量资料的二项分布和Poisson分布二项分布资料:总体率的95%可信区间为一,查表法:当样本含量n较小,如n50时,特别是p原理0.5时.根据n和阳性数X查百分率的可信区间表二,正态近似法:当样本含量n50,且样本率p或1-p均大于5时,p1.96Sp,即p-1.96Sp,p+1.96SpPoisson分布资料:总体平均数阳性数u95%可信区间为一,查表法,当样本计数X50时,用X值查Poisson分布u的可信区间二,正太近似法:当样本阳性数X50时,X-1.96X,X+1.96X11 / 11

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!