中科大概率论与数理统计讲义

上传人:功*** 文档编号:211358932 上传时间:2023-05-19 格式:DOCX 页数:109 大小:315.08KB
收藏 版权申诉 举报 下载
中科大概率论与数理统计讲义_第1页
第1页 / 共109页
中科大概率论与数理统计讲义_第2页
第2页 / 共109页
中科大概率论与数理统计讲义_第3页
第3页 / 共109页
资源描述:

《中科大概率论与数理统计讲义》由会员分享,可在线阅读,更多相关《中科大概率论与数理统计讲义(109页珍藏版)》请在装配图网上搜索。

1、概率论与数理统计讲义第一章事件与概率1?1.1概率论发展简史 1?1.2概率论的几个基本概念 1?1.2.1随机试验和随机事件 1?1.2.2事件的运算 2?1.2.3概率的定义及性质 4?1.2.4条件概率 6?1.2.5全概率公式和BayeS公式 8?1.2.6事件的独立性 10第二章随机变量及其分布13?2.1随机变量的概念 13?2.2离散型随机变量 14?2.2.1 0-1 分布 15?2.2.2 二项分布 16?2.2.3 POiSSOn分布16?2.2.4离散的均匀分布 18?2.3连续型随机变量 18?2.3.1正态分布 21?2.3.2指数分布 22?2.3.3均匀分布 24

2、?2.4 多维分布 24?2.5边缘分布 28?2.6条件分布和随机变量的独立性 29?2.6.1条件分布 29?2.6.2 随机变量的独立性 32?2.7随机变量的函数的概率分布 33第三章随机变量的数字特征41?3.1数学期望(均值)及中位数 42?3.1.1数学期望 42?3.1.2数学期望的性质 44?3.1.3条件期望 4573.1.4 中位数 47?3.2方差、标准差和矩 48?3.2.1方差和标准差 48?3.2.2 矩50?3.3协方差和相关系数 50?3.3.1协方差 50?3.3.2相关系数 51?3.4其他一些数字特征与相关函数 52?3.5大数定律和中心极限定理 54?

3、3.5.1大数定律 54?3.5.2 中心极限定理55第四章数理统计的基本概念及抽样分布58?4.1 弓 |言 58?4.1.1什么叫数理统计学 58?4.1.2数理统计学的应用 61?4.1.3统计学发展简史 63?4.2数理统计的若干基本概念64?4.2.1 总体和样本 64?4.2.2样本的两重性和简单随机样本 66?4.2.3统计模型 67?4.2.4统计推断 68?4.3 统计量 69?4.3.1统计量的定义 69?4.3.2若干常用的统计量70?4.4三大分布一2,t, F分布及正态总体样本均值和样本方差的分布71?4.4.1 X2 分布7174.4.2 t分布73?4.4.3 F

4、 分布74?4.4.4正态总体样本均值和样本方差的分布 76?4.4.5几个重要推论 76第五章参数估计79?5.1 点估计 79?5.1.1矩估计方法 79?5.1.2极大似然估计方法 81?5.1.3点估计的优良准则85?5.2 区间估计 86?5.2.1置信区间 87?5.2.2置信界 89?5.2.3确定样本大小 90第六章假设检验91?6.1基本概念和问题的提法 91?6.1.1零假设,对立假设,两类错误,拒绝域,显著性水平,功效 91?6.1.2假设检验问题的提法 93?6.1.3检验统计量的选取及假设检验的步骤94?6.2重要参数检验 95?6.2.1 一样本正态总体均值和方差的

5、检验 95?6.2.2两样本正态总体的情形 99?6.2.3成对数据 101?6.2.4 0-1分布中未知参数P的假设检验 102?6.3拟合优度检验103?6.3.1离散总体情形103?6.3.2列联表的独立性和齐一性检验 105?6.3.3连续总体情形107第一章事件与概率教学目的:1)掌握随机事件的概念和相关运算.2) 了解概率的不同定义,掌握古典概型的基本计算.3)掌握条件概率的概念,熟练运用全概率公式和BayeS公式.4)掌握事件独立的概念和有关运算.?1.1概率论发展简史概率论起源于17世纪,现在公认是1654年PaSCal与Fermat就赌博中的数学问题所展 开的讨论,在讨论中提

6、出了一些基本概念,最典型的例子是如何分赌本的问题.两个赌 徒相约赌若干局,谁先赢S局就算谁赢.由此提出期望的概念.之后几个数学大家HUygens, Bernouli, J, De Moivre等研究了这个问题,Bernouli对频率与概率接近这一事实给予了 理论上的阐述. 1812年LaPIaCe在分析概率论中最早叙述了概率论的几个基本定理, 给出了古典概率的明确定义.1814年在概率的哲学探讨一书中,记载了一个有趣的统 计故事,根据伦敦、彼得堡、柏林和全法国的统计资料,得出几乎一致的男婴和女婴出生 的比例为22:21,即男婴比例为51.16%,或男婴与女婴的比值为104.76:100,可是统

7、计1745- 1784年整整40年巴黎男婴的出生率时,得到的比例为25:24 (104.17:100),调杳研究后发现 巴黎人有遗弃男婴的陋习.1900年HiIbert在第二届世界数学家大会上提出了23个有名的 问题,主体是对新世纪数学发展方向的探讨.关于建立概率论的公理体系是他所提的 第六个问题“借助公理来研究那些在其中数学起重要作用的物理科学;首先是概率和力 学”.随后PoinCare,Borel等都对概率论公理体系的建立做出了努力,1933年苏联的大数 学家KOlmogorOV(1903-1987)正式提出了概率论的公理体系.概率论从此得到迅速的发展, 在此基础上,数理统计也得到了迅速的

8、发展.?1.2概率论的几个基本概念?1.2.1随机试验和随机事件随机现象:自然界中的客观现象,当人们观测它时,所得结果不能预先确定,而仅仅 是多种可能结果之一 .举例说明随机现象.随机试验:随机现象的实现和对它某个特征的观测.随机试验中要求试验的结果至少2个,每次试验或观测得到其中的一个结果,在试 验和观测之前不能预知是哪个结果发生。此外,要求在相同的条件下能重复试验。如观测把硬币抛4次后正面向上的次数;观测某地的温度变化;某电话总机单位时间 内转接的电话次数.定义121.基本事件:随机试验中的每个单一结果,它犹如分子中的原子,在化学反应 中不能再分,所以有“基本”两字.如把硬币抛3次后有8种

9、可能结果:正正正、正正反、正反正、反正正、正反反、反正 反、反反正、反反反.这8种可能结果的每一个都是基本事件.定义1.2.2.随机事件:简称事件,在随机试验中我们所关心的可能出现的各种结果,它 由一个或若干个基本事件组成.随机事件常用大写英文字母A, B, C, D等表示.如果用语言表达,则要用花括号括起 来.定义123.样本空间:随机试验中所有基本事件所构成的集合,通常用。或S表示.例1.2.1.掷一枚股子,观察出现的点数.则 = 1,2, 3, 4, 5. 6).例1.2.2.考察某一地区的年降雨量,贝I = x0 X V T),这里T表示某个常数,表示 降雨量不会超过T.定义1.2.4

10、.必然事件(Q):在试验中一定会发生的事件;不可能事件():在试验中不可能发生的事件.?1.2.2事件的运算可以证明,把样本空间中的基本事件与空间中的点相对应,则事件与集合相对应,因 此事件运算与集合运算可以建立一一对应关系.1 .子事件A c B:事件A发生蕴含事件B一定发生,则事件A称为事件B的子事件,记 为A c B .若A c B ,且B c A,则称事件A与事件B相等,记为A = B .2 .事件的和(A U B):事件A和事件B中至少有一个发生的这一事件称为事件A和事 件B的和,记为A U B .3 .事件的积(AUB):事件A和事件B同时发生这一事件称为事件A和事件B的积,记 为

11、AUB.如果A B = ,则称A和B不相容,即事件A和B不能同时发生.4 .对立事件Ac(或另):A不发生这一事件称为事件A的对立事件(或余事件).5 .事件A和事件B的差A_B:事件A发生而事件B不发生这一事件称为事件A和事件B的 差,记为A _B,或等价的,ABc .De MOrgan对偶法则:AlTB =Xn 力,上面公式可以推广到n个事件:n Aii=1UIii=1Ui=1Ai?1.2.3概率的定义及性质 1.概率的定义什么叫概率?直观地讲,概率是随机事件发生可能性大小的数字表征,其值在。和1之 间,换句话说,概率是事件的函数.如何求出事件A的概率(记为P(A)?古典概型:有两个条件,

12、第一,(有限性)试验结果只有有限个(记为n),第二,(等可能性)每个基本事件发生的可能性相同.为计算事件A的概率,设A中包含m个基本事件,则定义事件A的概率为记号:为方便起见,以#(B)记事件B中基本事件的个数,因此,P(A) =磊(2)概率的统计定义古典概型的两个条件往往不能满足,此时如何定义概率?常用的一种方法是把含 有事件A的随机试验独立重复做n次(BernOUli试验),设事件A发生了“次,称比值为 事件A发生的频率,当n越来越大时,频率会在某个值P附近波动,且波动越来越小,这个 值P就定义为事件A的概率.注意:为什么不能写为Iimn/0=P?因为?不是n的函数.几个例子:英文字母被使

13、用的频率是相当稳定的;福尔摩斯探案集第四本跳舞的 小人,福尔摩斯用频率破了丘比特和埃尔茜之间联络密码;1872年英国人Shix, W把算 到707位,1944.5-1945.3数学家法格逊认为的小数位的数字对。到9应该是等可能的,但核 对ShiX的结果发现数字7太少,故对ShiX的结果有怀疑,重新计算发现前527位是正确的, 后面不对了.计算机出现后,法国人让盖尤计算了的前100万位小数,发现各个数字出 现的频率相同.(3)主观概率关于概率的统计定义,我们可能会想到,如果试验不能在相同的条件下独立重复很 多次时该怎么办?还有人们常谈论种种事件出现机会的大小,如某人有80%的可能性办 成某事.如

14、某人有80%的可能性办成某事.另一人则认为仅有50%的可能性.即我们常常 会拿一个数字去估计这类事件发生的可能性,而心目中并不把它与频率挂钩.这种概率 称为主观概率,这类概率有相当的生活基础.在金融和管理等方面有大量的应用,这一 学派称为BayeS学派,近来得到越来越多的认可.但是当前用频率来定义概率的频率派 仍是数理统计的主流.焦点是频率派认为概率是客观存在,不可能因人而异. (4)概率的公理化定义对概率运算规定一些简单的基本法则,(i)设A是随机事件,则0 P(A) O ,称p,lm dP(AlB) = f为事件B发生条件下事件A发生的条件概率.注1.2.1. P (A)和P(AIB)是不

15、同的两个概率.如图,设矩形A的面积为1,则P(A)表示A的 面积,而P(AlB)表示在B中,A所占的比例,即AB这块面积在B中所占的比例.也可以从概率的统计定义,即用频率来近似概率这一角度来理解条件概率.设在n次 独立试验中,事件A发生了a次,事件B发生了r次,事件AB发生了ab次,事件B发生 下事件A发生的频率为ab P (AB)B S P (B)注1.2.2.事实上,我们所考虑的概率都是在一定条件下计算的,因为随机试验就是在一 定的条件下进行的,所以样本空间是相对而言的.如果把在一定条件下的事件试验看成 无条件的,则在补充条件下进行的事件试验的结果一般而言相对于原有结果要少,即样 本空间改

16、变了.所以所得随机事件的概率一般是不相同的.例1.25有10个产品,内有3个次品,从中一个个地抽取(不放回)检验,问第一次取到次 品后第二次再取到次品的概率.解:样本空间。是从10个产品中有序取出2个产品的不同方法,这是一个排列问题,易 知#。= IOX 9=90,记A =第一次取出的是次品, B =第二次取出的是次品, #(AB)=6, #A= 3,故P (BlA)=3 = =29P(A) 3/10注意,P (BA) = 2/9 P (A) = 3/10.例126.有三张相同的卡片和一顶帽子,第一张卡片两面都画有圈,第二张卡片一面画 圈,-面画星,第三张卡片两面都画星.现在庄家把卡片放在帽中

17、摇晃,然后让你任取一 张,把它放在桌上,设你看到卡片上面的图案为圈,然后庄家与你打赌下面的图案与上 面一样时算庄家赢,不一样是为你赢.请问这样的赌博是否是公平的?这是著名数学家,信息论的创建者之一A. WeaVer设计的,他曾在50年的科学美国 人上介绍过这个例子.请大家想一想,很有意思.例127.掷两个股子,观测出现的点数,分别以X和y表示第一和第二颗股子掷出的点数, 记A = (x, y) : X + y 9 , B = (x, y) : x y,求P(AIB)和P(BlA) .容易算出P(AlB) = 2/15 , P (BA) = 1/3,这说明这两个条件概率不是一回事.2.乘法定理由

18、 P(AIB)图告 P(AB) = P(AB)P(B)由归纳法容易推广为n个事件同时发生的概率有如下公式:P (AlA2 . An) = P (Ai)P (A2A1) . . . P (AnAl . . . An-1 )上面公式的右边看似麻烦,其实在实际中很容易算出.在没有给出n个事件之间相 互关系时,这是计算n个事件同时发生的一个重要公式.例1.2.8.某人忘了某饭店电话号码的最后一个数字,因而随意拨号,问他三次之内拨通 电话的概率.解:令Ai=第i次打通电话, i = 1, 2, 3 ,则P (3次内拨通电话)=P(AInA2 n A3)=1 _P(A 1A 2A 3)?1.2.5全概率公

19、式和BayeS公式1.全概率公式定义1.2.6.设Bi, B? , . . Bn是样本空间Q中的两两不相容的一组事件,即BiBj = , i # j ,且满足n,Bi = ,则称Bi, B2 , Bn是样本空间。的一个分割(又称为完备事件 群,英文为Partition).全概率公式:设B, B2 , . . . Bn是样本空间。的一个分割,A为。中的一个事件,则P (A)=比 P (ABi)P (Bi)i= 1目的:有时不容易直接计算事件A的概率,但是在每个Bi上A的条件概率容易求出.注意:应用中最重要的是验证B, B2 , . . . Bn构成样本空间的一个分割.例129.设某厂产品的一个零

20、部件是由三家上游厂商供货的.已知有一半是A厂提供 的,B厂商和C分别提供25% .已知厂商A和B的次品率都是2%, C的次品率为4%,从 该厂产品中任取一个产品,问该产品的这个零部件是次品的概率.解:记Bi =取到的产品是Bi厂生产的. i= 1,2,3,易见Bi, B2 , B3构成样本空间的一个 分l,且P(BI) = 0.5, P (B2)= P (B3)= 0.25, P (AB) = P (AB2) = 0.02, P (AB3) = 0.04, 由全概率公式马上得到P (A) = 0.02 X 0.5 + 0.02 0.25 + 0.04 X 0.25 = 0.025例1210.

21、一条家狗在野营后走失了,猜想狗有三种可能去向:A :它已回家,B:仍在原地啃骨头,C :已走失到附近的树林中去了.从狗的习性可估计上述三种可能性分别为1/4, 1/2, 1/4 . 一个小孩被派回去找狗,如 果狗仍在原地啃骨头,小孩能找到的可能性为9。,如果狗已走失到附近的树林中去了, 则小孩能找到的可能性为5。 .问小孩能找到狗的概率.解:可以分析得出狗的三种去向构成样本空间的一个分割,小孩能在不同情况下找到狗 的概率是条件概率,如果狗已回家,小孩能找到狗的概率为0由全概率公式可以算出小 孩能找到狗的概率为23/40 = 57.5%.设B, B2 , . . . Bn是样本空间的一个分割,A

22、为C中的一个事件,P (Bi) 0,i = 1,2,. , Q P (A) 0,则P (BiA) = N P旦也“3 P (ABj)P (Bj)什么情况下用BayeS公式?由公式知,分母就是事件A的概率,而分子和等式左边的 条件概率中的条件正好反过来.所以我们知道在因果关系互换时必须用BayeS公式.例1211.一种诊断某癌症的试剂,经临床试验有如下记录:有癌症病人阳性的概率 为95%,无癌症病人阴性的概率为95%现用这种试剂在某社区进行癌症普查,设该社区 癌症发病率为0. 5%,问某人反应为阳性时该人患癌症的概率.解:设A =反应为阳性, C =被诊断者患癌症,由题意,P (AC) = 0.

23、95, P (H Q = 0.95, P (C) = 0.005,现在要算的是P(ClA).这是典型的因果关系互换,只能用BayeS公式.P(CA)=P (AIC)P (C)P (AC)P (C) + P(AI巧P ( C) 0.95 X 0.0050.95 X 0.005 + 0.05 X 0.995 0.087 = 8.7%这说明用该试剂进行普查,准确性只有8.7%.计算表明,如果两次反应为阳性时患 癌症的概率达到了 64%.?1.2.6事件的独立性为了计算两个事件同时发生的概率,可以运用乘法定理,P (AB) = P (AB)P (B).什 么情况下P(AB) = P (A)P(B)?即

24、AB同时发生的概率等于两个事件单独发生概率的乘 积?为此我们有如下的定义:定义1.2.7.设A, B是随机试验中的两个事件,若满足P(AB) = P (A)P (B),则称事件A和B相 互独立.关于独立的概念,应该是从实际出发,如果能够判断事件B的发生与否对事件A的 发生与否不产生影响,则事件A, B即为独立.如把一个硬币掷两次,观测正反面出现的 情况,A =第一次出现正面, B =第二次出现正面, AB =两次都出现正面,样本空 间C有4个基本事件,#(AB) = 1, #(A) = 2, #(B) = 2,故P (AB) = 1/4, P (A)P (B) = 1/2 . 1/2 = 1/

25、4即事件A, B相互独立.事实上,我们容易判断第一次是否出现正面与第二次是否出 现正面没有任何影响,即独立的.设i表示事件A发生和不发生之一,Q表示事件B发生 和不发生之一.由独立性的定义可以推知P(4月) = P(4)P(Q),(这儿一共4个等式).独 立性的定义可以推广到n个事件.定义1.2.8.设A, A2 , An是随机试验中的n个事件,以4表示A或*之一.若满足P (A; A2 An) = P (A1 )P (A-2) .P (An),则称事件列Al, A2,. An相互独立.(上面有2n个等式)注意:上面等式等价于对Al, A2 , . . An中的任意k个事件Ai1, Ai2,

26、. . , Aik, k = 2, . . . n, 有P (Ai1 Ai2 . . . Aik) = P (Ai1 )P (Ai2 ) . . . P (Aik)注意:独立和不相容是不同的两个概念.例1.2.12. A, B, C三人独立地破译密码,每人能破译密码的概率分别为1/3, 1/4, 1/5 .问 密码能被破译的概率有多大?解:设D=密码被破译,A, B和C分别表示A, B和C三人能破译密码这三个事件,由独 立性,P (D) = P(AnBnC) = 1 _ P (4=1-P()P()P(O = i.12 = 0.6 .1Ji例1.2.13.在元件可靠性研究中,我们考虑如下两种电路

27、:其中1-4表示4个继电器,它们是否开通是相互独立的,设继电器导通的概率为P,(0 P O, i = 1, 2,.比 Pi= 1 .i概率函数(2.2.1)指出了全部概率1是如何在X的所有可能值之间分配的.它可以列 表的形式给出:可能值aa2a.概率PiP2Pi.有时也把(222)称为随机变量X的分布表.设。为一样本空间.X为定义于其上的一个离散型随机变量,其取值为Xi , x2 , .令A 为x , X2 , 的任意一个子集.事件X取值于A中的概率可根据概率的可加性来计算:P (A)=比 P (X = x).XeA这样知道了离散型随机变量X的概率函数,我们就能给出关于X的任何概率问题的回答.

28、下面我们给出常见的离散型分布.在描述离散概率模型时,BemoUIli试验是最早被 研究且应用及其广泛的概率模型.定义2.2.3.设一个随机试验只有两个可能结果A和1,则称此试验为一BemOUIH试验.定义2.2.4.设将一个可能结果为A和f的BernOUni试验独立地重复n次,使得事件A每次 出现的概率相同,则称此试验为n重Bernoulli试验.下面的0-1分布和二项分布都是以BernoUll试验为基础的.?2.2.1 01分布设随机变量X只取0,1两值尸(X = 1) = p,p (X = 0) = 1 _ P,则称X服从0-1分布 或BernOUlli分布.0-1分布是很多古典概率模型的

29、基础.?2.2.2二项分布设某事件A在一次试验中发生的概率为p.现把试验独立地重复n次.以X记A在这n次试 验中发生的次数,则X取值0, 1,,n ,且有/、P (X = k) =2 pk (1 .p)nk, k = 0, 1,. . . , n.(2.2.3)称X服从二项分布,记为X B (n,执从V%k(1,p)nk = (p1,p)n=1,C YKBl我们知道(2.2.3)确实是一个概率函数.为了考察这个分布是如何产生的,考虑事件X = .要使这个事件发生,必须在 这n次试验的原始记录AA IA. 3AJ中,有咋A, n _ i个凡每个A有概率P而每个H有概率1 _ p.又由于每次试验独

30、立,所以 每次出现A与否与其它次试验的结果独立.因此由概率乘法定理得出每个这样的原始结 果序列发生的概率为Pi(I _ p) .但是咋A和n _ i个f的排列总数是/,所以有咋A的 概率是:/、n Pi(1 _ P)ni. i = o, 1, , n.一个变量服从二项分布有两个条件:一是各次试验的条件是稳定的,这保证了事 件A的概率P在各次试验中保持不变;二是各次试验的独立性.现实生活中有许多现象 不同程度地满足这些条件.例如工厂每天生产的产品.假设每日生产n个产品.若原材料 质量,机器设备,工人操作水平等在一段时间内保持稳定,且每件产品是否合格与其它 产品合格与否并无显著性关联,则每日的废品

31、数服从二项分布.?2.2.3 POiSSOrl 分布设随机变量X的概率分布为P (X = k) = -e, k = o, 1,2 0,(2.2.4)A!则称X服从参数为人的PoiSSOn分布,并记X P ().由于e有级数展开式N AAQ = 1 + / i + 所以P (X = k) = 1. k=0穆德和格雷比尔著的统计学导论给出了PoiSSon分布的如下推导.假定体积为V的液体包含有一个大数目N的微生物.再假定微生物没有群居的本能, 它们能够在液体的任何部分出现,且在体积相等的部分出现的机会相同.现在我们取体 积为D的微量液体在显微镜下观察,问在这微量液体中将发现X个微生物的概率是什么?

32、 我们假定V远远大于D .由于假定了这些微生物是以一致的概率在液体中到处散布,因 此任何一个微生物在D中出现的概率都是D/V.再由于假定了微生物没有群居的本能, 所以一个微生物在D中的出现,不会影响另一个微生物在D中的出现与否.因此微生物 中有X个在D中出现的概率就是zN z z N X上 1 上(2.2.5)X lr V在这里我们还假定微生物是如此之小,拥挤的问题可以忽略不考虑,即N个微生物所占 据的部分对于体积D来说是微不足道.在(225)中令V和N趋向于无穷,且微生物的密度N/V = d保持常数.将(225)式改 写成如下形式:N(N - 1)( .V - 2).(N - J 4 1)

33、Z wD x Z 1 XD N-X V 。C。一J 9、(Dd)X J=x!当N变成无限时其极限为e-Dd (Dd)x x!(2.2.6)令Dd = ,则(226)和(224)的形式相同.这一推导过程还证明了是X的平均数,因为所 考察的一部分体积D乘以整个的密度d就给出了在D中所预计的平均数目.当N很大,p很小且NP趋于一个极限时,Poisson分布是二项分布的一个很好的近似. 而在N未知时,Poisson分布更显得有用.我们有下面的定理.定理2.2.1.在n重BernoUlIi试验中,以Pn代表事件A在试验中出现的概率,它与试验总 数n有关.如果叩n -人,则当n0时,Jd-Pn)nk-.(

34、227)例221 .现在需要100个符合规格的元件.从市场上买的该元件有废品率0.01 .考虑到有 废品存在,我们准备买100 + a个元件使得从中可以挑出100个符合规格的元件.我们要求 在这100 a个元件中至少有100个符合规格的元件的概率不小于0.95 .问a至少要多大?解:令A = 在100 + a个元件中至少有IOO个符合规格的元件.假定各元件是否合格是独立的.以X记在100a个元件中的废品数.则X服从n = 100a和P = 0.01的二项分布,且P(A)=E100 + a(0.01)(0 )o-i.上式中的概率很难计算.由于100 +a较大而0.01较小,且(IOO + a)(

35、0.01) = 1 + 0.01 as1, 我们以入=1的PoiSSOn分布来近似上述概率.因而aP (A)=比 1 IW.i=1当a = 0, 1,2, 3时,上式右边分别为0.368, 0.736, 0.920和0.981.故取a = 3已够了.?2.2.4离散的均匀分布设随机变量X取值a, a2,., an 1且有(2.2.8)P (X = ak) = , k = 1, ., n.N则称X服从离散的均匀分布.可以看出,离散的均匀分布正是古典概型的抽象.?2.3连续型随机变量离散随机变量只取有限个或可数无限个值,而连续型随机变量取不可数个值.这就 决定了不能用描述离散型随机变量的办法来刻划

36、连续型随机变量.考虑一个例子.假定步枪射手瞄准靶子在固定的位置进行一系列的射击.令X是命 中点与过靶心垂线的水平偏离值,设X取值L5cm, 5cm. X是一个连续随机变量.为了计算X落在某区间的概率,将L5, 5分为长为1厘米的小区间.对于每个小区间, 以落在这个小区间的弹孔数除以弹孔总数得到落在这个区间的弹孔的相对频数.设总 弹孔数为100我们得到下表:区间弹孔数相对频数L5,410.01.4, ,310.01_3, _260.06.2, ,1130.13Lr 0240.240,1270.271,2160.162,370.073,430.034,520.02上表可以用下图来表示:图2.3.1

37、弹孔位点分布图我们注意每个矩形的底等于1 ,高为该矩形的区间所对应的相对频数,所以面积为 相对频数.全部矩形的面积是1 .对于L5, 5的任一子区间,我们可以根据上图估计弹孔 落在该子区间的概率.例如要估计O VXV 2的概率,只要把区间中的两个矩形面积加 起来,结果得到0.43.再譬如说要估计J)25 X 1.5中的概率,我们应当计算该区间 上的面积,结果得到:0.06 + 0.27 + 0.08 = 0.41.如果第二批的100颗子弹射在靶子上,我们就将获得另一个经验分布.它与第一个 经验分布多半是不同的,尽管它们的外表可能相似.如果把观察到的相对频数看作为某 一“真”概率的估计,则我们假

38、定有一个函数,它将给出任何区间中的精确概率.这些概 率由曲线下的面积给出.由此我们得到如下定义:定义2.3.1. X称为连续型随机变量如果存在一个函数厂叫做X的概率密度函数它 满足下面的条件:1 .对所有的_o X 0;尸2 . 4f(x)dx = 1;3 .对于任意的_o a b +o,有P(a VXVb)=尸? f (x)dx.注 2.3.1.对于任意的_o X +0,有P(X = )=尸于f (u)du = 0.注2.3.2.如果f只取某有限区间a, b的值,令If) Xe a, b,=其它.则是定义在(_。,+。)上的密度函数,且f (X)和f()给出相同的概率分布.注2.3.3.假设

39、有总共一个单位的质量连续地分布在a X b.那么f (X)表示在点X的 质量密度且尸Cd f (x)dx表示在区间c, d上的全部质量.由于连续随机变量的概率是用积分给出的,我们可以直接处理密度的积分而不是密 度本身.定义2.3.2.设X为一连续型随机变量.则北(2.3.1)F (x) = f (u)du, 称为X的(累积)分布函数.-注2.3.4. F (X)表示的是随机变量的数值小于或等于X的概率,即F (X) = P (X X) _ O X +o.(2.3.2)由式(2.3.2)定义的F为X的(累积)分布函数的一般定义.它适用于任意的随机变量.设X为 一离散型随机变量,它以概率於,,Pn

40、 , .取值向,,an ,.,则F ()=比 pi .a匚北分布函数F具有下列性质:F是非减的函数;(2) Iim北F (X) = 0;(3) Iim北/+ F (X) = 1.对于连续随机变量,如果F(X)在点X的导数存在,则f() = Fo(x).连续随机变量的分布函数的图象如下图所示.下面我们介绍常见的连续型分布.它们包括正态分布,指数分布和均匀分布.?2.3.1 正态分布如果一个随机变量X具有概率密度函数f(x) =!exp, _o X +o,(2.3.3)其中_o 0 ,则称X为一正态随机变量,记为XN (, 2 ).以(2.3.3)为 密度的分布称为参数为和。2的正态分布.具有参数

41、 = 0,= 1的正态分布称为标准正态分布.用(X)和(x)表示标准正态分 布N(0, 1)的分布函数和密度函数.从图(233)可以看出,正态分布的密度函数是以X = 为对称轴的对称函数 称为 位置参数.密度函数在X = 处达到最大值,在(_。,)和(, +。)内严格单调.同时我们 看到,。的大小决定了密度函数的陡峭程度.通常称。为正态分布的形状参数.以F(X)记正态分布N(, 2 )的概率分布函数,则恒有F(X) = (如J)所以任一正态 分布的概率分布函数都可通过标准正态分布的分布函数计算出来.图2.3.2 (累积)分布函数例2.3.1.求数k使得对于正态分布的变量有P( _ k X +

42、k) = 0.95.解:令F为正态分布N(, 2 )的分布函数,则有P(-kx0(2,3.5)O x0为常数,则称X服从参数为人的指数分布.指数分布的分布函数为l 1 e -Ax X 6(2,3.6)F (X) = x)h(x) = Iim -11uxOx失效率表示了元件在时刻X尚能正常工作,在时刻X以后,单位时间内发生失效的概率.则 如果h(x) = (常数),0 X 。有P (X s + 11 X s) = P (X t).(2.3.7)即寿命是无老化的.可以证明,指数分布是唯一具有性质(237)的连续型分布.图2.3.4指数分布的密度函数?2.3.3 均匀分布设a b ,如果分布F(X)

43、具有密度函数1号 f (X) = Oa X b ,其它,(2.3.8)则称该分布为区间a, b上的均匀分布,记作Ua, b.如此定义的f (X)显然是一个概率密度 函数.容易算出其相应的分布函数为I ,F (X) =:日I, 1,X a1a X b.在计算时因四舍五入而产生的误差可以用均匀分布来描述.?2.4多维分布在实际应用中,经常需要对所考虑的问题用多个变量来描述.我们把多个随机变量 放在一起组成向量,称为多维随机变量或者随机向量.例2.4.1.从一付扑克牌中抽牌时,可以用纸牌的花色和数字来说明其特征.例2.4.2.考虑一个打靶的试验.在靶面上取定一个直角坐标系.则命中的位置可由其坐 标(

44、X, Y)来刻划 X ,丫都是随机变量.定义2.4.1.设X = (Xi , . . . , Xn).如果每个Xi都是一个随机变量i = 1, . . . , n 则 称X为n维随机变量或者随机向量.我们可以按照对常用一维随机变量的分类把常用的随机向量分为离散型和连续型 的.定义2.4.2.如果每一个Xi都是一个离散型随机变量i = 1,n 则称X = (Xi, . . . , Xn)为 一n维离散随机变量.设Xi的所有可能取值为加,H2, . . ., i = 1, . . . , n,则称P(j1 , . . . , jn) = P (Xi = aij1, . . . , Xn = ajn

45、), J1 , ., jn = 1,2, .(2.4.1)为n维随机变量X的概率函数.容易证明概率函数具有下列性质:(1) p(j , . . . , jn) O, ji= 1,2, . . . , i = 1,2, . . . , n;4(2) . .P(j .,jn) = 1.Jl ,J我们具体来看一下二维离散分布.设二维离散型随机变量(X, Y)的所有可能取值 为(Xi, yj):i=1nJ =1,2,,m.我们经常以列联表的形式来表示二维离散型随机变量的概率分布.记pij = P (X = Xi, Y = yj), i = 1, ., , j = 1, ., m.则(X, Y)的概率函

46、数可以下表表示:、VX12. Xn行和YyP11P21p1p.V2P12P229P2BP.2ymp1 mP2mPmP. m列和Pi.P2.p.1例2.4.3.从一个包含五个黑球,六个白球和七个红球的罐子里抽取四个球.令X是抽到 白球的数目,Y是抽到红球的数目.则二维随机变量(X, 丫)的概率函数为/ 5、p(x, y) = XyOx + y 4.(2.4.2)z18,以列联表表示,即为4 y 、01234行和01234-L-LWW-L61251102153204153列和992211416125134512041类似于一维连续型随机变量,连续型随机向量的也是由密度函数来刻画的.定义2.4.3.

47、称X = (X1 , . . . , Xn)为n维连续型随机变量如果存在Rn上的非负函数f(x“.,Xn)使得对任意的_0 Val Vbl V +0,,_0 VanVbnV +0,有与P (a Xi bi , ., a Xn b) =f( , . . . , x)dx1 . . . d,(2.4.3)则称f为X的概率密度函数.对n维随机变量我们也有分布函数的概念.定义2.4.4.设X = (Xi , . . . , Xn)为n维随机变量.对任意的(H,.x) e Rf称F(X1 , . . . , Xn) = P (Xi 1 , . . . , Xn Xn)(2.4.4)为n维随机变量X的(联

48、合)分布函数.可以验证分布函数F(XIXn)具有下述性质:(1) F (X1 . . . . . Xn)对每个变元单调非降;(2)对任意的 1 VjVrl有,Iim F (x1 , . . . , x) = 0;i / - O(3) Iim F (,. ., Xn) = 1.1 O,., Xn/ O对n维连续型随机变量,从密度的定义我们有,n xiF ( , . . . , Xn) =. f (1 , ., Xn)d .dXn .-O -O对高维离散型随机变量,一般我们不使用分布函数.例2.4.4.考虑二维随机变量X = (Xi, X2) z其概率密度函数为1f, 、1/(b_a)(d_c)当 avxvb c x2 d,f X1,X2 =J一/0其它称此概率密度为a, b c, d上的均匀分布.例2.4.5.设(X, Y)的概率密度函数有形式一 、11(j - u)2 C , -%l -D22(1 -P2)x2”彳其中_o a, b 0, 0 1 , 2 0, _1 p *P2BP.2ymPl mP2mPmP. m列和PrP2.P.1从上述列联表我们可以计算随机变量X和Y的分布.固定某个Xi.因为Y在使得X

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!