统计学名称解释

上传人:m**** 文档编号:214400898 上传时间:2023-05-29 格式:DOCX 页数:7 大小:34.41KB
收藏 版权申诉 举报 下载
统计学名称解释_第1页
第1页 / 共7页
统计学名称解释_第2页
第2页 / 共7页
统计学名称解释_第3页
第3页 / 共7页
资源描述:

《统计学名称解释》由会员分享,可在线阅读,更多相关《统计学名称解释(7页珍藏版)》请在装配图网上搜索。

1、第一章一、名词解释1、参数(parameter):也叫参变量,是一个变量。如果我们引入一个或一些另外的变量来描 述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的 变量叫做参变量或参数。描述总体特征的概括性数字度量, 它是研究者想要了解的总体 的某种特征值。2、统计量(statistic):描述样本特征的数,是统计理论中用来对数据进行分析、检验 的变量。3、总体(population):根据研究目的确定的研究对象的全体。当研究有具体而明确的 指标时,总体是指该项变量值的全体。4、样本(sample):从总体中随机抽取的部分观察单位,总体中有代表性的一部分。5、同质

2、(homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。6、变异(variation):同质事物个体间的差异。来源于一些未加控制或无法控制的甚至不 明原因的因素。7、概率(probability):度量随机事件发生可能性大小的一个数值,是一个在0到1之间 的实数。8、抽样误差(sampling error):由于抽样所造成的样本统计量与总体参数的差别。 三、简答题1、统计学的基本步骤有哪些? 设计、搜集、整理、分析资料2、总体与样本的区别与关系?区别: 总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是指该项 变量值的全体。样本:总体中有代表性的

3、一部分。 联系:总体包含样本,样本是总体中的一部分3、抽样误差产生的原因有哪些?可以避免抽样误差吗? 产生原因:(1) 总体单位的标志值的差异程度。差异程度愈大则抽样误差愈大,反之则愈小。(2) 样本单位数的多少。在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。(3) 抽样方法。抽样方法不同,抽样误差也不相同。一般说,重复抽样比不重复抽样,误差 要大些。(4) 抽样调查的组织形式。抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织 形式的合理程度也会影响抽样误差。不可以,它具有不可避免性,只能减少抽样误差4、何为概率及小概率事件?概率:度量随机事件发生可能性大小的一个数值,是一个

4、在0到1之间的实数。 小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将p (A)W0.05或0.01称为小概率事件,认为小概率事件在一次试验中不可能发生。第二章第三章1. 正态分布(normal dis tribu tion):也叫高斯分布(Gaussian dis tribu tion), 一种最 常见、最重要的连续型对称分布(正态分布是对称分布,但对称分布不一定是正态分布)2. 中位数(median):是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在 位次上的平均水平。3. 四分位数间距(quartile interval):是上四分位数与下四分位数之差

5、,用四分位数 间距可反映变异程度的大小.即:Q3 -Q14. 方差(variance):样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。 反映一组数据的平均离散水平。5. 正偏态分布(positively skewed distribution):也称右偏态分布,右侧的组段数 多于左侧的组段数,频数向右侧拖尾6. 负偏态分布(nega tively skewed dis trib ut ion):左偏态分布,左侧的组段数多于 右侧的组段数,频数向左侧拖尾正谕石倔)贡诟【左谊丿扫)偏惑分布7. 对数正态分布(logari thmic normal dis trib ut ion):对

6、数为正态分布的任意随机变 量的概率分布。如果 X是正态分布的随机变量,则 exp(X)为对数分布;同样,如 果Y是对数正态分布,则log( Y)为正态分布。&医学参考值范围(medical reference range):指绝大多数正常人的解剖、生理、生化、 免疫及组织代谢产物的含量等各种数据的波动范围。最常用的是95%参考值范围。三、简答题1. 描述数值变量资料集中趋势的指标有哪些?其适用范围有何异同?平均数:描述一组变量值的集中位置或平均水平的指标体系。不同的分布使用不同的指标(算术)均数:正态或近似正态或观察值相差不大的小样本资料几何均数:对数正态分布或等比级数资料中位数:一般偏态分布

7、(传染病发病的潜伏期)2. 描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同?反映数据的离散度(Dispersion )。即个体观察值的变异(variation)程度。常用的指标有:1. 极差(Range)(全距)适用范围:任何计量资料;是参考变异指标2. 百分位数与四分位数间距Percentile and Quartile range百分位数:适用范围广泛,可用于偏态资料,分布不明的资料和分布两端无确定值的资料 四分位数间距:常用于描述偏态分布资料的离散程度,值越大一一变异程度越大,中位数与 四分位间距一起使用,描述偏态分布资料的特征。3. 方差Variance正态分布资料4. 标准

8、差Standard Deviation适用范围:均数与标准差经常被同时用来描述正态分布资料 的集中和离散趋势。5. 变异系数Coefficient of Variation适用范围:主要用于单位不同或均数相差悬殊资料3. 医学中参考值范围的涵义是什么?确定的步骤和方法是什么?医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等 各种数据的波动范围。最常用的是95%参考值范围。步骤与方法:1).确定“正常人”对象的范围:即根据研究目的确定的未患被研究疾病的 个体。2) .统一测定标准:即检验用的试剂批号、仪器、人员、条件等应相同。3) .确定分组:一般需用年龄、性别等对

9、“正常人”对象进行分组,分组特征也可根据检 验判断。4) .样本含量确定:一般来讲,正态分布资料所需的样本含量应在100以上,偏态或未知 分布时样本含量应更大。5) .确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。6) .确定百分位点:一般取95%或99%。第四章第五章一、名词解释1标准误(standard error):表示样本统计量抽样误差大小的统计指标,统计上通常将统计 量(如样本均数、样本率p等)的标准差称为标准误。2可信区间(confidence interval):按一定的概率或可信度(1-a)用一个区间来估计总 体参数所在的范围 ,该范围通常称为参数的可信

10、区间或者置信区间 (confidenceinterval,CI),预先给定的概率(1-a)称为可信度或者置信度(confidencelevel), 常取 95%或 99%。3假设检验(hypothesis testing):利用样本提供的信息判断假设是否成立的统计方法称为 统计假设检验。4统计推断(statistical inference):用一个或一系列样本的结果去估计总体可能的结果 的过程。包括假设检验和参数估计。5 I型错误(typel error):: “实际无差别,但下了有差别的结论”,假阳性错误。犯这种 错误的概率是a(其值等于检验水准)6 II型错误(type II error

11、): “实际有差别,但下了不拒绝HO的结论”,假阴性错误。犯 这种错误的概率是卩(其值未知)7检验效能(power of test):当两总体确有差别,按检验水准a所能发现这种差别的能 力。8变量变换(variable transformation):也称变量代换,是将原始数据作某种函数转换, 如转换为对数值。三、简答题 1假设检验的基本原理和步骤。假设检验过去称显著性检验。它是利用小概率反证法,从问题的对立面(H0)出发间接判断要 解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。1. 建立检验假设,确定检验水准(选用单侧或双侧检验)(1) 无效假设(nu

12、ll hypothesis)零假设,记为H0;(2) 备择假设又称对立假设,记为H1。2. 计算检验统计量 根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。3. 确定P值,下结论。选定显著性水平a的值,Pa不拒绝HO,但不能下“无差别”或“相等”的结论,只能下“根据目前试验 结果,尚不能认为有差别”的结论。2标准差和标准误的异同。相同点: 都是用来表示变异程度的,均是反映随机误差的。区别:标准差与标准误的意义、作用和使用范围均不同。标准差(亦称单数标准差)一般用SD表 示,是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度

13、,是数据精密度 的衡量指标;而标准误一般用SE表示,反映样本平均数对总体平均数的变异程度,从而反映 抽样误差,是量度结果精密度的指标。标准差是最常用的统计量,一般用于表示一组样本变量的分散程度;标准误一般用于统计 推断中,主要包括假设检验和参数估计,如样本平均数的假设检验、参数的区间估计与点估计 等。3参考值范围和置信区间有何区别? 参考值范围是指具有明确背景资料的参考人群某项指标的测定值,例如医学参考范围指包括 绝大多数的正常人的人体形态,功能和代谢产物等,表示值时可能有单侧也可能有双侧,表示 方法为正态分布或百分位数法.置信区间是指在做区间的估计时指按一定的概率(1-a)估计总体参数所在的

14、范围,其中(1-a )被 称为置信度,两者的不同之处在于前者是对于某种指标的估计,后者是对参数的估计。 置信区间与参考值范围的意义、计算公式和用途均不同。1. 从意义来看95%参考值范围是指同质总体内包括 95%个体值的估计范围,而总体均数 95% 可信区间是指按95%可信度估计的总体均数的所在范围。2. 从计算公式看若指标服从正态分布,95 %参考值范围的公式是:x 1.96s。总体均数95 %可信区间的公式是:。未知的小样本 X 土 tS。未知的大0.05/2,v x样本X 土 US-0.05/2,v x前者用标准差,后者用标准误。前者用1.96,后者用a为0.05,自由度为v的t或 u

15、界值。4 t检验和方差分析的基本思想各是什么?二者的区别是什么?t 检验(假设检验的一种):假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(PV0.01或PV0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检 验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不 成立,若可能性大,则还不能认为假设不成立。方差分析的基本思想是根据资料设计的类型及研究目的,可将总变异分解为两个或多个部 分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误 差,即可了解该因素对测定结果有无影响。区别:t检验可用于2个样本均数差异

16、的显著性检验,但不适于多组均数的检验。方差分析是判断多组(三3 )数据之间均数差异是否显著的一种假设检验方法。5、t检验和t检验的应用条件有何异同?t 检验:样本含量 n 较小时(如 n40,专用公式;20Vb+cW40,用校正公式;b+c5, n充分大,凡是能用u检验的都可以用卡方检验,U2=X2 (v=1);2. 两者都有连续性校正问题;二者的不同点:1.由于正态分布可确定单双侧检验界值,当满足正态分布近似条件时,可使用u检验进 行单侧检验;2满足四格表U检验的资料,计算两率间的95%可信区间,尚可分析两率之差有无实际 意义;3. x2检验可用于2X2列联表资料有无关联的检验5、请列举RXC表X2检验的注意事项。(1)注意对T值大小的要求:要求TV5的个数不能超过1/5,且不能有TV1。 如果不符可选用以下方法处理: 1.增加样本例数; 2.相邻行列例数进行合理地合并;3. 删去理论数小的行或列; 4.确切概率法。( 2)注意多组比较结果如为差别有显著性,并不代表每两组差别有显著性,如需分析 可进一步作两两比较。(3)注意有序行X列表资料不宜采用X2检验,因为X2检验与分类变量的顺序无关。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!