第1章概率统计基础知识(中级)

上传人:gui****hi 文档编号:195820223 上传时间:2023-03-21 格式:PPT 页数:110 大小:8.83MB
收藏 版权申诉 举报 下载
第1章概率统计基础知识(中级)_第1页
第1页 / 共110页
第1章概率统计基础知识(中级)_第2页
第2页 / 共110页
第1章概率统计基础知识(中级)_第3页
第3页 / 共110页
资源描述:

《第1章概率统计基础知识(中级)》由会员分享,可在线阅读,更多相关《第1章概率统计基础知识(中级)(110页珍藏版)》请在装配图网上搜索。

1、第一章第一章 概率统计基础知识(中级)概率统计基础知识(中级)第一节第一节 概率基础知识概率基础知识一、事件与概率一、事件与概率(一)随机现象(一)随机现象 随机现象随机现象 在一定条件下,并不总是出现相同结果在一定条件下,并不总是出现相同结果的现象。的现象。特点特点 随机现象的结果至少有两个随机现象的结果至少有两个 至于哪一个出现,人们事先并不知道至于哪一个出现,人们事先并不知道 样本点样本点 认识一个随机现象,首要的是能罗列出认识一个随机现象,首要的是能罗列出它的一切可能发生的基本结果。这里的基本它的一切可能发生的基本结果。这里的基本结果是今后的抽样单元即样本点。结果是今后的抽样单元即样本

2、点。样本空间:记为样本空间:记为 随机现象可能样本点的全部称为这个随随机现象可能样本点的全部称为这个随机现象的样本空间。机现象的样本空间。(二)随机事件(二)随机事件 事件(随机事件):随机现象的某些样本点组事件(随机事件):随机现象的某些样本点组 成的集合。用大写英文字成的集合。用大写英文字 母母A、B、C表示。表示。随机事件的特征随机事件的特征 任一事件任一事件A是相应样本空间是相应样本空间中的一个子集。中的一个子集。事件事件A发生当且仅当(发生当且仅当()A 中某一样本点中某一样本点 发生。发生。事件事件A的表示可用集合,也可用语言,但所用的表示可用集合,也可用语言,但所用 语言要大家明

3、白无误。语言要大家明白无误。任一样本空间任一样本空间有一个最大子集即有一个最大子集即;它对;它对 应的事件称为必然事件,仍用应的事件称为必然事件,仍用表示。表示。任一样本空间任一样本空间都有一个最小子集即空集,都有一个最小子集即空集,它对应的事件称为不可能事件,记为它对应的事件称为不可能事件,记为 随机事件的关系随机事件的关系 包含:包含:A B或或B A 在一个随机现象中有两个事件在一个随机现象中有两个事件A与与B,若,若事件事件A中任一个样本点必在中任一个样本点必在B中,则称中,则称A被包被包含在含在B中,或中,或B包含包含A。互不相容互不相容 在一个随机现象中有两个事件在一个随机现象中有

4、两个事件A与与B,若,若事件事件A与与B没有相同的样本点,则称没有相同的样本点,则称A与与B互不互不相容。相容。可推广到三个或更多个事件间的互不相容可推广到三个或更多个事件间的互不相容 相等:相等:A=B即即A B且且B A 在一个随机现象中有两个事件在一个随机现象中有两个事件A与与B,若样,若样本本A与与B含有相同的样本点,则称事件含有相同的样本点,则称事件A与与B相相等。等。例:例:A=(x,y):):x+y=奇数奇数B=(x,y):):x与与y的奇偶性不同的奇偶性不同A=B=(1,2),(1,4),(1,6),(2.1),(2,3),(2,5)(3,2),(3,4),(3,6)则:则:(

5、三)事件的运算(三)事件的运算 事件运算事件运算 对立事件:对立事件:AA 在一个随机现象中,在一个随机现象中,是样本空间,是样本空间,A为事件,为事件,则由在则由在中而不在中而不在A中的样本点组成的事件称为中的样本点组成的事件称为A的对立事件,记的对立事件,记 。A则则AA ,事件事件A与与B的并:的并:A B 由事件由事件A与与B中所有样本点(相同的只计入中所有样本点(相同的只计入一次)组成的新事件。称为一次)组成的新事件。称为A与与B的并,的并,发发生意味着生意味着“事件事件A与与B至少一个发生至少一个发生”BA 事件事件A与与B的交:的交:A B或或AB 由事件由事件A与与B中公共的样

6、本点组成的新事件称中公共的样本点组成的新事件称为事件为事件A与与B的交。的交。发生意味着发生意味着“事件事件A与与B同时发生同时发生”BA 事件的并和交可推广到更多个事件上去。事件的并和交可推广到更多个事件上去。事件事件A对对B的差:的差:A-B 由在事件由在事件A中而不在中而不在B中的样本点组成的中的样本点组成的新事件,称为新事件,称为A对对B的差。的差。(a)A-B(b)A-B()BA 事件运算性质:事件运算性质:交换律:交换律:,ABBA ABBA 结合律:结合律:CBACBA CBACBA 分配律:分配律:CABACBA CABACBA 对偶律:对偶律:BABA BABA 可用维恩图验

7、证,可推广到三个或三个以上可用维恩图验证,可推广到三个或三个以上事件的运算。事件的运算。(四)事件的概率(四)事件的概率 概率概率事件发生可能性大小的度量事件发生可能性大小的度量 在一个随机现象中,用来表示任一随机事件在一个随机现象中,用来表示任一随机事件A发生可能性大小的实数称为该事件的概率,记发生可能性大小的实数称为该事件的概率,记为为P(A)。)。概率是一个介于概率是一个介于0和和1之间的数,即之间的数,即0P(A)1;必然事件的概率等于必然事件的概率等于1,即,即P()=1;不可能事件的概率等于不可能事件的概率等于0,即,即P()=0。二、概率的古典定义与统计定义二、概率的古典定义与统

8、计定义(一)古典定义(一)古典定义 所涉及的随机现象只有有限个样本点。如所涉及的随机现象只有有限个样本点。如 共有共有n个样本点;个样本点;每个样本点出现的可能性是相同的(等可每个样本点出现的可能性是相同的(等可 能性);能性);假如被考察事件假如被考察事件A含有含有K个样本点,则事件个样本点,则事件 A的概率定义为的概率定义为中中样样本本点点的的总总数数中中含含样样本本点点的的个个数数 AnK)A(P(二)统计定义(二)统计定义 与考察事件与考察事件A有关的随机现象是可以大量有关的随机现象是可以大量 重复试验的;重复试验的;若在若在n次重复试验中,事件次重复试验中,事件A发生发生Kn次,则次

9、,则 事件事件A发生的频率为:发生的频率为:重复试验数重复试验数发生次数发生次数事件事件AnK)A(fnn fn(A)将会随着重复试验次数不断增加而趋将会随着重复试验次数不断增加而趋 于稳定,这个频率的稳定值就是事件于稳定,这个频率的稳定值就是事件A的概的概 率。一般用重复次数率。一般用重复次数n较大时的频率去近似较大时的频率去近似 概率。概率。三、概率的性质及其运算法则三、概率的性质及其运算法则 概率的性质:(可由概率的定义看出)概率的性质:(可由概率的定义看出)性质性质1:对任意事件:对任意事件A,有,有0P(A)1;性质性质2:)(1)(APAP 性质性质3:若:若A B 则则P(A-B

10、)=P(A)-P(B)性质性质4:P(AB)=P(A)+P(B)-P(AB)若若A与与B互不相容互不相容P(AB)=P(A)+P(B)性质性质5:对于多个互不相容事件:对于多个互不相容事件A1,A2,有有P(A1A2A3)=P(A1)+P()+p(A3)+;四、条件概率与概率的乘法法则四、条件概率与概率的乘法法则(1)条件概率)条件概率 两个事件两个事件A与与B,在事件,在事件B已发生的条件下,事已发生的条件下,事件件A再发生的概率称为条件概率,记再发生的概率称为条件概率,记P(A/B)。)。计算公式:计算公式:)B(P()B(P)AB(P)BA(P0 性质性质6:对任意二个事件:对任意二个事

11、件A与与B,有,有 P(AB)=P(A B)P(B)=P(B A)P(A)P(B)0 P(A)0(2)独立性和独立事件的概率)独立性和独立事件的概率 相互独立:相互独立:设有两个事件设有两个事件A与与B,假如其中一个事件,假如其中一个事件的发生不影响另一个事件的发生与否,则称的发生不影响另一个事件的发生与否,则称A事件与事件与B事件相互独立。事件相互独立。性质性质7:假如二个事件假如二个事件A与与B相互独立,则相互独立,则A与与B同同时发生的概率为时发生的概率为P(AB)=P(A)P(B)性质性质8:假如二个事件假如二个事件A与与B相互独立,则在事件相互独立,则在事件B发生条件下,事件发生条件

12、下,事件A的条件概率的条件概率P(A B)等等于事件于事件A的(无条件)概率的(无条件)概率p(A)()()()()()()(APBPBPAPBPABPBAP 事件的相互独立可推广到三个或更多的事件事件的相互独立可推广到三个或更多的事件 上去。上去。第二节第二节 随机变量及其分布随机变量及其分布 一、随机变量一、随机变量 随机变量随机变量 用来表示随机现象结果的变量称为随机变用来表示随机现象结果的变量称为随机变量。常用大写字母量。常用大写字母X、Y、Z表示。表示。随机变量类型随机变量类型 离散随机变量离散随机变量 一个随机变量仅取数轴上有限个点或可列一个随机变量仅取数轴上有限个点或可列个点,则

13、此随机变量为离散(型)随机变量。个点,则此随机变量为离散(型)随机变量。连续随机变量连续随机变量 如一个随机变量的所有可能取值充满数轴如一个随机变量的所有可能取值充满数轴上一个范围(上一个范围(a,b)或整个数轴,则此随机变)或整个数轴,则此随机变量为连续(型)随机变量。量为连续(型)随机变量。二、随机变量的分布二、随机变量的分布 随机变量的分布随机变量的分布 随机变量取值的统计规律性。随机变量取值的统计规律性。随机变量随机变量X的分布内容:的分布内容:X可能取哪些值或在哪个区间上取值可能取哪些值或在哪个区间上取值 X取这些值的概率各是多少?或取这些值的概率各是多少?或X在任在任一小区间上取值

14、的概率是多少?一小区间上取值的概率是多少?(一)离散随机变量的分布(一)离散随机变量的分布 离散随机变量的分布可用分布列表示(离离散随机变量的分布可用分布列表示(离散分布)散分布)分布列分布列 或用数学式表达:或用数学式表达:P(X=Xi)=pi i=1,2n(p1+pn=1)pi也称为分布的概率函数也称为分布的概率函数 X X1 X2 Xn P p1 p2 pn (二)连续随机变量的分布(二)连续随机变量的分布 用概率密度函数表示(简称分布)用概率密度函数表示(简称分布)条件:条件:p(x)0 1)(dxxp 概率密度函数概率密度函数p(x)的各种形式的各种形式 位置不同位置不同 散布不同散

15、布不同 形状不同形状不同 其中其中p(x)在在x0点的值点的值p(x)不是概率,是高度。不是概率,是高度。注:纵轴原为注:纵轴原为“单位长度上的频率单位长度上的频率”,由,由频率的稳定性,可用概率代替频率,纵轴就成频率的稳定性,可用概率代替频率,纵轴就成为为“单位长度上的概率单位长度上的概率”即概率密度的概念,即概率密度的概念,故最后形成的曲线称为概率密度曲线。故最后形成的曲线称为概率密度曲线。p(x)x 重要结论:重要结论:1X在区间(在区间(a,b)上取值的概率)上取值的概率 p(aXb)为概率密度曲线以下区间(为概率密度曲线以下区间(a,b)上的面积,即上的面积,即 P(ab)=badx

16、xp)(2.X在一点取值的概率为零,即在一点取值的概率为零,即 P(X=a)=0 故:故:P(axb)=P(axb)=P(aXb)=P(aXb)三、随机变量分布的均值、方差与标准差三、随机变量分布的均值、方差与标准差 均值:均值:用来表示分布的中心位置,用用来表示分布的中心位置,用E(X)表示表示 X是离散随机变量是离散随机变量X是连续随机变量是连续随机变量)(XE iipxdxxxp )(方差:方差:用来表示分布的散布大小,用用来表示分布的散布大小,用Var(x)表示表示 )(XVarX是离散随机变量是离散随机变量X是连续随机变量是连续随机变量iiPxEx2)(dxxPxEx)()(2 标准

17、差:用标准差:用表示表示)()(XVarX 表示分布散布大小。表示分布散布大小。均值与方差的运算性质均值与方差的运算性质 对任意二个随机变量对任意二个随机变量X1和和X2,有,有 E(X1+X2)=E(X1)+E(X2)设设X为随机变量,为随机变量,a与与b为任意常数,有为任意常数,有 E(ax+b)=aE(x)+b)()(2XVarabaXVar 设设X1与与X2相互独立相互独立)()()(2121XVarXVarXXVar (和的方差等于方差之和)(和的方差等于方差之和)这个性质可推广到三个或更多个相互独立这个性质可推广到三个或更多个相互独立 随机变量场合随机变量场合 方差的这个性质不能推

18、广到标准差场方差的这个性质不能推广到标准差场合,对任意两个相互独立的随机变量合,对任意两个相互独立的随机变量X1与与X2,(X1+X2)(X1)+(X2)而应为:而应为:)X(Var)X(Var)XX(2121 方差具有可加性,标准差不具有可加性。方差具有可加性,标准差不具有可加性。四、常用分布四、常用分布(一)常用的离散分布(一)常用的离散分布 二项分布二项分布 xnxnx)p(p)xX(P 1x=0,1,n 其中其中 表示从表示从n个不同元素取个不同元素取出出x个的组合数。个的组合数。)!xn(!x!nnx 记为记为b(n,p)二项分布均值、方差和标准差二项分布均值、方差和标准差 均值均值

19、E(x)=np 方差:方差:Var(x)=np(1-p)标准差:标准差:)p(np 1 泊松分布:(常用于计点过程)泊松分布:(常用于计点过程)e!x)xX(PXx=0,1,2,记为记为P()其中其中e=2.71828 泊松分布均值、方差和标准差泊松分布均值、方差和标准差 均值:均值:E(X)=方差:方差:)X(Var 标准差:标准差:超几何分布:(不放回抽样)超几何分布:(不放回抽样)NnMNxnMx)xX(P x=1,2,r式中式中r=min(n,M)M为为N中所含不合格品数中所含不合格品数n为样本量为样本量记为记为h(n,N,M)超几何分布均值、方差、标准差超几何分布均值、方差、标准差

20、均值:均值:NnM)X(E 方差:方差:MNNMN)nN(n)X(Var 11(二)连续型随机变量的分布(二)连续型随机变量的分布 正态分布:能描述很多质量特性正态分布:能描述很多质量特性X随机取值随机取值 的统计规律性。的统计规律性。正态分布概率密度函数:正态分布概率密度函数:(-x+)正态分布含两个参数正态分布含两个参数和和,常记:,常记:N(,2)。其。其中中为分布均值(即分布中心);为分布均值(即分布中心);2为分布方差;为分布方差;0为分布标准差。为分布标准差。222)(21)(xexp 正态分布概率密度函数图形分析正态分布概率密度函数图形分析 标准正态分布:标准正态分布:=0且且=

21、1的正态分布,称的正态分布,称 为标准正态分布,记为标准正态分布,记N(0,1),其变量记),其变量记 为为U,概率密度函数记为,概率密度函数记为(u)2221ue)u(标准正态分布表及其应用标准正态分布表及其应用 标准正态分布表标准正态分布表可用于计算形如可用于计算形如“Uu”随机事件发生的概率。随机事件发生的概率。如:如:查附表得查附表得0.93575).().U(P521521 U(p)aU(P )a()a U(P)a()a 1)a()a(1)a()b()bUa(P 12 )a()aU(P)aUa(P)aU(P )()(aa )(1)(aa 1)(2 a 标准正态分布标准正态分布N(0,

22、1)的分位数的分位数 分位数(分位数(为为01间实数)间实数)指它的左侧面积恰好为指它的左侧面积恰好为,右侧面积恰好,右侧面积恰好为为1-,即用概率表达,即用概率表达 )uU(P当当=0.5时,称为中位数,时,称为中位数,N(0,1)分布中分布中u0.50 0.5时,如时,如=0.25则则u0.25=-u0.75 查附表查附表 u0.75=0.675,故,故u0.25=-0.675 1 u 正态分布的计算正态分布的计算性质性质1:设:设 ,则,则),(NX2 ),(NXU10 性质性质2:设:设 ,则对任意实数,则对任意实数a,b有有),(NX2 b)bX(P a)aX(P1 ab)bXa(P

23、 不合格品率不合格品率为产品质量特性为产品质量特性X超出规范限(超出规范限(TL,TU)的概率)的概率 X超出超出TU(上规范限)的概率记(上规范限)的概率记PUpU=P(XTU)X超出超出TL(下规范限)的概率记(下规范限)的概率记PLpL=P(XTL)X的不合格品率的不合格品率P=PU+PL正态分布中心正态分布中心 计算不合格品率要知道两件事:计算不合格品率要知道两件事:质量特性质量特性X的分布,在过程受控情况下,的分布,在过程受控情况下,常为正态分布常为正态分布N(,2)产品规范限,是对产品质量特性所作的要产品规范限,是对产品质量特性所作的要求,这些要求可能是顾客要求;可能是标求,这些要

24、求可能是顾客要求;可能是标准;可能是企业规定的技术要求。准;可能是企业规定的技术要求。则:则:)(1)(UUUTTXPp)()(LLLTTXPp其中其中 可查标准正态分布函数表可查标准正态分布函数表)(TLTu 当正态分布中心当正态分布中心=规范中心规范中心 时产品质量特性时产品质量特性X超出规范超出规范3的不合格率的不合格率 2ULTTMpL=P(x-3)=(-3)=1-(3)=1-0.99865=0.00135=1350PPmpU=P(x+3)=1-(3)=0.00135=1350PPmp=pL+pU=0.00135+0.00135=0.0027=2700PPm-6-5-4-3-2-2 3

25、 4 56规范限规范限123456合格品率(合格品率(%)68.2795.4599.7399.993799.99994399.9999998不合格品率(不合格品率(ppm)317300 45500 2700 63 0.57 .002(三)其他连续分布(三)其他连续分布 均匀分布均匀分布 在区间(在区间(a,b)上的均匀分布,记)上的均匀分布,记U(a、b)0,ax xb b其它其它)x(pab 1 均值、方差、标准差均值、方差、标准差均值均值 2ba)X(E 方差方差122)ab()X(Var 标准差标准差122)ab(指数分布指数分布0,)x(pxe ,0 x0 x记为记为 ,其中,其中0。

26、)(Exp 均值均值 ,方差,方差 ,标准差,标准差 1)X(E21 )X(Var 1 对数正态分布(特点)对数正态分布(特点)随机变量都在正半轴(随机变量都在正半轴(0,+)上取值)上取值 大量取值在左边,少量取值在右边,且很大量取值在左边,少量取值在右边,且很分散,这样的分布称之为右偏分布。(曲分散,这样的分布称之为右偏分布。(曲线的尾巴在右边)线的尾巴在右边)对数正态分布密度函数对数正态分布密度函数正态分布的密度函数正态分布的密度函数 最重要特征:最重要特征:若随机变量若随机变量X服从对数正态分布,则作对服从对数正态分布,则作对数变换数变换 后,服从正态分布。后,服从正态分布。xYln

27、记正态分布的均值为记正态分布的均值为 ,方差为,方差为 ,则相,则相应的对数正态分布的均应的对数正态分布的均 与方差与方差 分别为分别为y 2y x 2x 均值:均值:2222yye/exp)x(Eyyx 方差:方差:1222 yxxexp)x(Var 若若X服从对数正态分布,则服从对数正态分布,则)ln(ln)(aXPaXP )ln(aYP yya ln五、中心极限定理五、中心极限定理 随机变量的独立性随机变量的独立性 随机变量随机变量X1与与X2相互独立是指其中一个取相互独立是指其中一个取什么值不影响另一个的取值,或者说是指两个什么值不影响另一个的取值,或者说是指两个随机变量独立的取值,互

28、不影响。随机变量独立的取值,互不影响。随机变量的独立性可以推广到随机变量的独立性可以推广到3个或更多个或更多个随机变量。个随机变量。中心极限定理中心极限定理 在统计中,多个相互独立随机变量的平均在统计中,多个相互独立随机变量的平均值(仍然是一个随机变量)将服从或近似服从值(仍然是一个随机变量)将服从或近似服从正态分布。正态分布。即即n个相互独立同分布的随机变量个相互独立同分布的随机变量X1,X2,Xn,均值,均值和方差和方差 都存在,则在都存在,则在n较大时,其样本均值较大时,其样本均值 服从或近似服从正态分服从或近似服从正态分布布N(,)。)。2 xn2 第三节第三节 统计基础知识统计基础知

29、识一、总体、个体与样本一、总体、个体与样本(一)总体与个体(一)总体与个体总体:在一个统计问题中,我们把研究对象的总体:在一个统计问题中,我们把研究对象的 全体成为总体。全体成为总体。当研究产品某个特定的质量特性当研究产品某个特定的质量特性X时,时,也常把全体产品的特性看做为总体。也常把全体产品的特性看做为总体。个体:构成总体的每个成员。个体:构成总体的每个成员。当研究产品的某个特定的质量特性当研究产品的某个特定的质量特性X时,时,把一个具体产品的特性值把一个具体产品的特性值x视为个体。视为个体。(二)随机样本(二)随机样本 满足下面两个条件的样本称为简单随机样满足下面两个条件的样本称为简单随

30、机样本,简称随机样本:本,简称随机样本:1.随机性。总体中每个个体都有相同的机会随机性。总体中每个个体都有相同的机会入样。入样。2.独立性。从总体中抽取的每个样品对其它独立性。从总体中抽取的每个样品对其它 样本的的抽取无任何影响。样本的的抽取无任何影响。随机样本可看做随机样本可看做n个相互独立的、同分布个相互独立的、同分布 的随机变量,其分布与总体分布相同。的随机变量,其分布与总体分布相同。下面所述的样本都是指满足这两个要求的下面所述的样本都是指满足这两个要求的 简单随机样本。简单随机样本。二、频数(频率)直方图二、频数(频率)直方图 为了研究数据的变化规律,需要对数据进行为了研究数据的变化规

31、律,需要对数据进行一定的加工整理。直方图是为研究数据变化规律一定的加工整理。直方图是为研究数据变化规律而对数据进行加工整理的一种基本方法。而对数据进行加工整理的一种基本方法。(一)直方图的作法(一)直方图的作法 例例1.3-3 食品厂用自动装罐机生产罐头食品,食品厂用自动装罐机生产罐头食品,从一批罐头中随机抽取从一批罐头中随机抽取100个进行称量,获得罐个进行称量,获得罐头的净重数据如下:头的净重数据如下:342 352 346 344 343 339 336 342 347340340 350 347 336 341 349 346 348 342346347 346 346 345 344

32、 350 348 352 340356339 348 338 342 347 347 344 343 349341348 341 340 347 342 337 344 340 344346342 344 345 338 351 348 345 339 343345346 344 344 344 343 345 345 350 353345352 350 345 343 347 354 350 343 350344351 348 352 344 345 349 332 343 340346342 335 349 348 344 347 341 346 341342为了解这组数据的分布规律,对数

33、据做如下整理:为了解这组数据的分布规律,对数据做如下整理:(1)找出这组数据中的最大值)找出这组数据中的最大值xmax及最小值及最小值xmin,计算它们的差,计算它们的差R=xmax-xmin,R称为极差,称为极差,也就是这组数据的取值范围。在本例中也就是这组数据的取值范围。在本例中xmax=356,xmin=332,从而,从而R=356-332=24。(2)根据数据个数,即样本量)根据数据个数,即样本量n,决定分组数,决定分组数k及组距及组距h。一批数据究竟分多少组,通常根据一批数据究竟分多少组,通常根据n的多少的多少而定,不过这也不是绝对的,教材中而定,不过这也不是绝对的,教材中1.3-2

34、是可是可以参考的分组数。以参考的分组数。选择选择k的原则是要能显示出数据中所隐藏的的原则是要能显示出数据中所隐藏的规律,组数不能过多,但也不能太少。规律,组数不能过多,但也不能太少。每一组的区间长度,称为组距。组距可以每一组的区间长度,称为组距。组距可以相等,也可以不相等。组距相等的情况用得比相等,也可以不相等。组距相等的情况用得比较多,不过也有不少情形在对应于数据最大及较多,不过也有不少情形在对应于数据最大及最小的一个或两个组,使用与其他组不相等的最小的一个或两个组,使用与其他组不相等的组距。对于完全相等的组距,通常取组距组距。对于完全相等的组距,通常取组距h为为接近的某个整数值。接近的某个

35、整数值。在本例中,在本例中,n=100,取,取k=9,R/k=24/9=2.7,故取组距故取组距h=3。(3)确定组限,即每个区间的端点及组中)确定组限,即每个区间的端点及组中值。为了避免一个数据可能同时属于两个组,值。为了避免一个数据可能同时属于两个组,因此通常将各组的区间确定为左开右闭的:因此通常将各组的区间确定为左开右闭的:通常要求通常要求 xmin,xmax。在等距分组。在等距分组时,时,而每一组的组中值而每一组的组中值0akahaa 01haa 12haakk 1)aa(xiii 121 在本例中取在本例中取 =331.5,则每组的组限及,则每组的组限及组中值见表组中值见表1.3-3

36、。0a,(12110kkaaaaaa,(,(,(,(,(4)计算落在每组的数据的频数及频率)计算落在每组的数据的频数及频率 确定分组后,统计每组的频数,即落在组确定分组后,统计每组的频数,即落在组中的数据个数以及频率中的数据个数以及频率 ,列出每组的,列出每组的频数、频率表,见表频数、频率表,见表1.3-3。n/nfii 频数、频率及累积频率表频数、频率及累积频率表组号组号 i(1iiaa,ix in if 1(331.5,334.5 333 1 0.01 2(334.5,337.5 336 4 0.04 3(337.5,340.5 339 11 0.11 4(340.5,343.5 342

37、20 0.20 5(343.5,346.5 345 30 0.30 6(346.5,349.5 348 19 0.19 7(349.5,352.5 351 12 0.12 8(352.5,355.5 354 2 0.02 9(355.5,358.5 357 1 0.01 合计合计 100 1.00 表表1.3-3(5)作频数频率直方图)作频数频率直方图 在横轴上标上每个组的组限,以每一组的在横轴上标上每个组的组限,以每一组的区间为底,以频数(频率)为高画一个矩形,区间为底,以频数(频率)为高画一个矩形,所得的图形称为频数(频率)直方图,如图所得的图形称为频数(频率)直方图,如图1.3-4。在本

38、例中频数直方图及频率直方图的形。在本例中频数直方图及频率直方图的形状是完全一致的。这是因为分组是等距的。状是完全一致的。这是因为分组是等距的。在分组不完全等距的情形,在作频率直在分组不完全等距的情形,在作频率直方图时,应当用每一个组的频率与组距的比方图时,应当用每一个组的频率与组距的比值值 /为高作矩形。此时以每个矩形的面积为高作矩形。此时以每个矩形的面积表示频率。表示频率。ifih频数(频率)直方图频数(频率)直方图(二)直方图的观察与分析(二)直方图的观察与分析a.对称型对称型b.偏态型偏态型c.孤岛型孤岛型d.锯齿型锯齿型e.平顶型平顶型f.双峰型双峰型三、统计量与抽样分布三、统计量与抽

39、样分布1统计量的概念统计量的概念不含未知参数的样本函数不含未知参数的样本函数 样本均值、样本中位数、样本极差、样本样本均值、样本中位数、样本极差、样本 方差、样本标准差及样本变异系数等都是方差、样本标准差及样本变异系数等都是 统计量,只有众数除外。统计量,只有众数除外。2抽样分布抽样分布统计量的分布称为抽样分布统计量的分布称为抽样分布(一)样本数据集中位置的统计量(一)样本数据集中位置的统计量(1)样本均值)样本均值x niixnx11(2)样本中位数)样本中位数Me(或或 )x 1222121nnnxxx)x(Me,n为奇数为奇数,n为偶数为偶数(3)众数()众数(Mod)数据中出现频率最高

40、的值。数据中出现频率最高的值。(二)描述样本数据分散程度的统计量(二)描述样本数据分散程度的统计量(1)样本极差)样本极差)()n(xxR1 (2)样本方差)样本方差 niixxnS12211 因为因为n个离差(个离差()的总和为零,所以)的总和为零,所以对于对于n个独立数据,独立的离差个数只有个独立数据,独立的离差个数只有n-1个,称个,称n-1为离差(或离差平方和)的为离差(或离差平方和)的自由度。故方差用离差平方和除以自由度。故方差用离差平方和除以n-1。xxi 简化计算公式:简化计算公式:niixnxnS122211或或 niniiixnxnS12122111(3)样本标准差)样本标准

41、差2SS 标准差的量纲与数据的量纲一致标准差的量纲与数据的量纲一致(4)样本变异系数)样本变异系数xsC 四、常用抽样分布四、常用抽样分布1 的分布的分布X 设设X服从服从N(,),(),(x1,x2,xn)是由总体是由总体X中抽取的一个样本,则服从中抽取的一个样本,则服从 N(,)2 n/2(1)的精确分布的精确分布X(2)的渐进分布的渐进分布X 设设X为任意分布,(为任意分布,(x1,x2,xn)是由总体是由总体X中抽取一个样本,若中抽取一个样本,若 ,则当,则当n时,时,近似服从近似服从 N(,)。)。)x(Ei02 )x(VariXn/2(3)分布分布2 设设X服从服从N(0,1),且

42、设(,且设(x1,x2,xn)是由总体是由总体X中抽取的一个样本,则中抽取的一个样本,则222212n 服从自由度为服从自由度为n的的 分布,记作分布,记作 (n)。2 2 2 设设X服从服从N(,),则),则2)n(S)n(11222 (3)t 分布分布 设随机变量设随机变量X,Y相互独立,相互独立,XN(0,1),Y (n)则则 服从自由度为服从自由度为n的的t分布记分布记作作tt(n)2xn/YXt 设设XN(,),(),(x1,x2,xn)是由总体是由总体X中抽取的一个样本,则中抽取的一个样本,则2)n(tn/sxt1 设设X和和Y相互独立,且相互独立,且XN(,),),YN(,),(

43、),(x1,x2,xn1)与)与 (y1,y2,yn2)分别由总体)分别由总体X和和Y中抽中抽 取的样本,则取的样本,则2 2)nn(tnnnnS)n(S)n()()yx(21121121212122221121 (4)F 分布分布 设设X与与Y相互独立,且相互独立,且X2(N1),Y2(N2)则则 服从自由度为(服从自由度为(N1,N2)的)的F 分布。分布。记作记作 FF(N1,N2)。21N/YN/XF 设设X和和Y相互独立,相互独立,X ,Y ,(x1,x2,xn)与与(y1,y2,ym)分别由分别由X 和和Y中抽取的样本,则中抽取的样本,则 211 ,N 222 ,N22222121

44、 /S/SF(n1,m1)当当 =时,则时,则21 22 2)m,n(FSS112221 正态分布正态分布 1t 分布分布 nntt 12 分布分布 221nn 21211f,fFf,fF F分布分布第四节第四节 参数估计参数估计一、点估计一、点估计1概念概念 设设 是一个未知参数,是一个未知参数,由总由总体体X中抽取的样本,则用中抽取的样本,则用 来估来估计计 ,则称,则称 为为 的估计量(或称估计)。的估计量(或称估计)。nX,X,X21 nX,X,X21 2矩法估计矩法估计(1)用样本矩估计相应总体矩;)用样本矩估计相应总体矩;(2)用样本矩的函数估计相应总体矩的函数。)用样本矩的函数估

45、计相应总体矩的函数。例如用样本均值估计总体均值;用样本方例如用样本均值估计总体均值;用样本方差(标准差)来估计总体方差(标准差)。差(标准差)来估计总体方差(标准差)。3.点估计优劣的评选标准点估计优劣的评选标准(1)无偏性)无偏性 设设 是是的一个估计量,若的一个估计量,若 ,则,则称称 是是的无偏估计。的无偏估计。E(2)有效性)有效性 设设 都是都是的无偏估计量,若对一切的无偏估计量,若对一切的可能取值有:的可能取值有:21 ,,且至少有一个,且至少有一个 ,严格,严格不等号成立,则不等号成立,则 比比 有效。有效。21 VarVar0 1 2(3)正态总体参数的无偏估计)正态总体参数的

46、无偏估计 的无偏估计有两个,即的无偏估计有两个,即 和和 。xx 的无偏估计常用的只有一个,即的无偏估计常用的只有一个,即 。2 2S 的无偏估计有两个,即的无偏估计有两个,即 和和 2dR4CS二、区间估计二、区间估计(一)区间估计的概念(一)区间估计的概念 设设是总体分布中的未知参数,其一切可能取是总体分布中的未知参数,其一切可能取值组成的参数空间为值组成的参数空间为 ,从总体中抽取一个样本,从总体中抽取一个样本(x1,x2,xn),对给定的,对给定的 ,确定,确定两个统计量:两个统计量:与与 10 nLLx,x,x21 nuux,x,x21 对任意的对任意的 有有 1uLP 则称则称L,

47、u是是的置信水平为的置信水平为 的置信的置信区间。区间。1 1-置信区间的含义:置信区间的含义:所构造的一个随机区间所构造的一个随机区间 能包含未知参能包含未知参数数 的概率为的概率为1-。由于这个随机区间会随样本。由于这个随机区间会随样本观察值的不同而不同,它有时包含了参数观察值的不同而不同,它有时包含了参数 ,有时,有时没有包含没有包含 ,但是用这种方法作区间估计时,但是用这种方法作区间估计时,100次中大约有次中大约有100(1-)个区间能包含未知参数个区间能包含未知参数 。UL,(二)一个正态总体均值与方差的置信区间(二)一个正态总体均值与方差的置信区间(1)已知,求已知,求 的置信区

48、间的置信区间2 的的1-置信区间为:置信区间为:nuxnux 2121(2)未知,求未知,求 的置信区间的置信区间2 nsntxnsntx112121 (3)方差)方差 的的1-的置信区间(的置信区间(未知)未知)2 111122222212 nSnnSn(4)标准差)标准差 的的1-的置信区间(未知)的置信区间(未知)111122221 nnSnnS(三)比例(三)比例p的置信区间(大样本场合)的置信区间(大样本场合)设总体设总体 ,样本为,样本为x1,x2,xn,样本之和为样本之和为K,样本均值为,样本均值为 则则 p,bX1nKx nKp (点估计)(点估计)当当n相当大时,相当大时,故

49、,故p的的 置信区间。置信区间。n/pp,pNx 1 1 n/xxuxpn/xxux 112121其中其中 是标准正态分布的是标准正态分布的 分位数。分位数。21 u21 第五节第五节 假设检验假设检验 基本思想基本思想 根据所获得的样本,运用统计分析的方法,根据所获得的样本,运用统计分析的方法,对总体对总体X的某种假设的某种假设H0作出接受或拒绝的决定。作出接受或拒绝的决定。(二)基本步骤(二)基本步骤1建立假设建立假设 H0称为原假设,称为原假设,H1称为备择假设,如关称为备择假设,如关于均值于均值 常用有三类假设:常用有三类假设:H0:,H1:0 0 (1)H0:,H1:0 0 (2)H

50、0:H1:0 0 (3)(1),(),(2)称为单边假设检验)称为单边假设检验(3)称为双边假设检验)称为双边假设检验 2寻找检验统计量寻找检验统计量T,确定拒绝域的形式,确定拒绝域的形式 3给出显著性水平给出显著性水平 4给出临界值,确定拒绝域给出临界值,确定拒绝域 5根据样本观察值计算检验统计量的观察根据样本观察值计算检验统计量的观察值,根据计算结果作出拒绝或接受值,根据计算结果作出拒绝或接受H0的判断。的判断。一个正态总体的假设检验一个正态总体的假设检验1.已知已知 ,检验,检验H0:,H1:2 0 6 (1)检验统计量)检验统计量n/xu 0(2)给定)给定 ,查标准正态分布函数值表定

51、出临,查标准正态分布函数值表定出临界值界值 21 u(3)由样本观察值计算出统计量)由样本观察值计算出统计量u(4)作出判定)作出判定当当 接受接受H021 uu21 uu拒绝拒绝H0,接受,接受H12.已知已知 ,检验,检验H0:,H1:2 0 0 (1)检验统计量)检验统计量n/xu 0(2)给定)给定 ,定出临界值,定出临界值 1u(3)由样本观察值计算出统计量)由样本观察值计算出统计量u(4)判定)判定当当 接受接受H0 1uu 1uu拒绝拒绝H0,接收,接收H13.已知已知 ,检验,检验H0:,H1:2 0 0 (1)检验统计量)检验统计量n/xu 0(2)给定)给定 ,定出临界值,

52、定出临界值 u(3)由样本观察值计算出统计量)由样本观察值计算出统计量u(4)判定)判定当当 接受接受H0 uu 拒绝拒绝H0,接受,接受H1 uu4.未知未知 ,则用,则用t检验法检验法2 把上述的统计量把上述的统计量u换成换成t,即,即n/Sxt 对给定的对给定的 ,查,查t一分布表,确定临界值,一分布表,确定临界值,然后作出接受或拒绝的判定。然后作出接受或拒绝的判定。5.未知,检验未知,检验H0:,H1:202 202 (1)检验统计量)检验统计量 20221 Sn(2)给定)给定 ,查,查 分布表,定出临界值分布表,定出临界值 2 122 n和和 1221 n(3)由样本观察值计算出统计量)由样本观察值计算出统计量2 当当 11221222 nn接受接受H0,否则拒绝,否则拒绝H0,接受,接受H1。三、有关比例三、有关比例p的假设检验的假设检验 设设Xb(1,p),x1,x2,xn由总体由总体X抽取的一抽取的一个样本,当个样本,当n较大时,根据中心极限定理,较大时,根据中心极限定理,近似服从正态分布,近似服从正态分布,则,则x n)p(ppN1,n/)p(ppxu 1近似服从近似服从N(0,1)则可获得则可获得p的近似的近似u检验。检验。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!