正态分布和线性回归讲义

上传人:daj****de2 文档编号:197815786 上传时间:2023-04-06 格式:DOCX 页数:10 大小:84.29KB
收藏 版权申诉 举报 下载
正态分布和线性回归讲义_第1页
第1页 / 共10页
正态分布和线性回归讲义_第2页
第2页 / 共10页
正态分布和线性回归讲义_第3页
第3页 / 共10页
资源描述:

《正态分布和线性回归讲义》由会员分享,可在线阅读,更多相关《正态分布和线性回归讲义(10页珍藏版)》请在装配图网上搜索。

1、一、【检查作业并讲评】二、【课前热身】了解学生对本次内容的掌握情况,便于查漏补缺。三、【内容讲解】1.正态分布密度函数:f (x) . e 10, 8x8)&o其中n是圆周率;。是自然对数的底;x是随机变量的取值;p为正态分布的均值;o是正态分布的标准差.正态分布一般记为N(q2).2.正态分布N(,b2)是由均值p和标准差o唯一决定的分布标准正态分布曲y黄低)=2兀对于标准正态总体N (0, 1)中邕)是总体取值小于的概率,3. 正态曲线的性质:正态分布由参数p、o唯一确定,如果随机变量&N(p , o 2),根据定义有:p =E 七,o =D 七。正态曲线具有以下性质:(1) 曲线在x轴的

2、上方,与x轴不相交。(2) 曲线关于直线x =p对称。(3) 曲线在x =p时位于最高点。(4) 当x p时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为渐 近线,向它无限靠近。(5) 当p 一定时,曲线的形状由。确定。o越大,曲线越“矮胖”,表示总体越分散;o越小,曲线越“瘦 高”,表示总体的分布越集中。五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学.、1 x 24. 标准正态曲线:当p =0、o =l时,正态总体称为标准正态总体,其相应的函数表示式是f (x) = = e 2 ,v2k(8x + 8)其相应的曲线称为标准正态曲线标准正态总体N(0,

3、 1)在正态总体的研究中占有重要的地位任何正态分布的概率问题均可转化成标准正 态分布的概率问题5. 标准正态总体的概率问题:(qJ)e 2即中() P(X 0 ,图中阴影部分的面积表示为概率P(x X0),只要有标准正态分布表即可查表解决.从图中不难发现:当 x0 0 时,中(x0) = 1中(x0);而当 x0 = 0 时,(0)=0.5 *6. 标准正态分布表标准正态总体N(0,1)在正态总体的研究中有非常重要的地位,为此专门制作了 “标准正态分布表”.在这个表中,对应于X的值中(x )是指总体取值小于x的概率,即 中(x ) = P(x 0).000000若 x0 0,则中(x0) =

4、1中(x0).利用标准正态分布表,可以求出标准正态总体在任意区间(气,x 2)内取值的概率,即直线x =气,x = x与正态曲线、x轴所围成的曲边梯形的面积 P(x x r.5,上面y与x是线性相关的,当r| Wr命或 认为线性关系不显著讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;通过两个变量 是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;我们研究的对象是两个变量的线 性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到,题型讲解例1已知连续型随机变量z的概率密度函数0(x 0)kx +1(0 x 2),且 f(x)

5、30,求常数 k 的值,并计算概率 P(1.5W & 2)分析:凡是计算连续型随机变量&的密度函数f(x)中的参数、概率P(aW & Wb)都需要通过求面积来转化而求 得。若f(x) 30且在a,b上为线性,那么P(aW& Wb)的值等于以b-a为高,f(a)与f(b)为上、下底的直角梯形 ,八 1的面积,即 P (a & b) = - f (a) + f (b)(b-a)。解:1 = P(-88 +8) = P(-8& 0) + P(0 & 2) + P(2 & +8)1=0 + P(0 & 2) + 0 = -f (0) + f (2)(2 -0) = f (0) + f (2) = 2

6、+ 2kA:,P(1.5&2.5)= P(1.5&2)+P(2&2.5)= P(1.5&2)=16。4,xR。例2设XN(,b 2),且总体密度曲线的函数表达式为: f (x)二 e - J2p兀(1) 求p , a ;(2) 求P(l X - 1U2)及 P(1 一巨 x 1 + 2巨)的值。分析:根据表示正态曲线函数的结构特征,对照已知函数求出p和a。利用一般正态总体N( Jb2)与标 准正态总体N(0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。解:(1)由于 f (x) = eI 厂= _1e一2葛,2钏气2兀八2根据一般正态分布的函数表达形式,可知p =1,。=-J2,

7、故XN (1, 2)。(2) P(l x -11 2) = P(1-q x 1 + *;2)=w+mf -广=21+ (2-1 -)i寸1)2、/2=(1)中(1) = 2 (1)1 = 2 x 0.8413 1=0.6826。又 P(1 -克 x 1 + 2 再)=F (1 + 2 克)F (1-此1+ 2 2 11 v 2 1=中(-)中(一)=中-(-1)2 120)= 1 P( 120) = 1 中120 10) r 0.02310 J.120分以上的考生人数为1000X0.023 = 23x U、点评:通过公式F (x) = Q (一 )转化成标准正态总体,然后查标准正态分布表即可一

8、b例4将温度调节器放置在贮存着某种液体的容器内,调节器设定在d C,液体的温度& (单位:。C)是 一个随机变量,且gN (d,0.52).(1) 若d=90,求g 89的概率;(2) 若要保持液体的温度至少为80 C的概率不低于0.99,问d至少是多少?(其中若N (0,1),则 (2) =P (n 2) =0.9772,(2.327) =P (门 2.327) =0.01).分析:(1)要求P (g 89) =F (89),.gN (d,0.5)不是标准正态分布,而给出的是少(2),(2.327),故需转化为标准正态分布的数 值.(2)转化为标准正态分布下的数值求概率p,再利用p30.99

9、,解d.,一一89 90、解:(1) P (g 89) =F (89) =0 ()0.5=0 (2) =1 0 (2) =10.9772=0.0228.(2)由已知 d 满足 0.99WP (g 380),即 1P (g 80)310.01,P (g 80)W0.01.挪(80 ) 0.01=0 (-2.327).0.5.80 - d. 0.5-2.327.dW81.1635.故d至少为81.1635.点评:(1)若&N (0, 1),则=凹N (0, 1) . (2)标准正态分布的密度函数/危)是偶函数, bx0时,f (x)为减函数.例5在实际生活中,常用统计中假设检验的思想检验产品是否合

10、格,方法是:(1)提出统计假设:某种指标服从正态分布N (,02);(2)确定一次试验中的取值a;(3)作出统计推断:若ae(p -30,p +30 ),则接受假设,若ag (p -3a,p +30 ),则拒绝假设.某砖瓦厂生产的砖的“抗断强度”&服从正态分布N (30,0.8),质检人员从该厂某一天生产的000块砖中随 机抽查一块,测得它的抗断强度为27.5 kg/cm2,你认为该厂这天生产的这批砖是否合格?为什么?解:由于在一次试验中&落在区间(p -30,p +30 )内的概率为0.997, 故f几乎必然落在上述区间内.于是把p =30,0 =0.8代入,算出区间(p -30,p +30

11、 ) = (27.6,32.4),而 27.5 w (27.6,32.4).据此认为这批砖不合格.例6已知测量误差fN (2, 100) (cm),必须进行多少次测量,才能使至少有一次测量误差的绝对值 不超过8 cm的频率大于0.9?解:设表示n次测量中绝对误差不超过8 cm的次数,则B (n,p).8 2、. . 8 2、其中 P=P (|f |0.9,n 应满足 p (n 31) =1-p (n =0) =1(1p) “0.9,n 晾1-.9)lg(1 - 0.5671)因此,至少要进行3次测量,才能使至少有一次误差的绝对值不超过cm的概率大于0.9.例7已知某地每单位面积菜地年平均使用氮

12、肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下 数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1) 求x与y之间的相关系数,并检验是否线性相关;(2) 若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每 单位面积蔬菜的年平均产量。分析:(1

13、)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05与自由度15-2相应的相关 系数临界,005比较,若, ,005则线性相关,否则不线性相关。解:(1)列出下表,并借科学计算器进行有关计算:i123456789101112131415xi707480788592909592108115123130138145y i5.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0x;y;357444544608.4765938.490011401058118813571500.616251766.41885,-1515151.7x =

14、 1 0,1 y = 10.111515支 x2 = 161125,区 y2 = 1628.55iii=1i=1故蔬菜产量与放用氮肥量的相关系数区 x y = 16076.8。i=116076.8 -15 x 101 x 10.11r = .r 0.8 6 4 3.(161125 -15 x 1012)(1628.55 -15 x 10.112)由于n=15,故自由度15-2=13。由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值r005 = 0.514,贝0r r。, 从而说明蔬菜产量与氮肥量之间存在着线性相关关系。加05 x y -15xy(2)设所求的回归直线方程

15、为y = bx + a,则b = i七=160 :;5:;r 0.037 ,%2161125 -15 x 11 2乙 x 2 -15 x2ii=1a = y - bx = 10.11 - 0.0 9 次 17 0 W0.6 4 6 3.回归直线方程为 y = 0.0937x + 0.6463 = 14.701。)。点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。如果会使用含统计的科学计算器,能简单得到 二, y2 , y2 , x y这些量,也就无需有制表这一=1i=1i=1i=1i=1步,直接算出结果就行了。另外,利用计算机中有关应用程序也可以对这些数据进

16、行处理。例8假设关于某设备的使用年限x和所支出的维修费用y (万元),有如下的统计资料:x23456y2.23.85.56.57.0若由资料可知y对x呈线性相关关系。试求:(1) 线性回归方程;(2) 估计使用年限为10年时,维修费用是多少?分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。解:(1)列表如下:i12345xi23456yi2.23.85.56.57.0x;y;4.411.422.032.542.0x249162536x = 4, y = 5,% x 2 = 90, % x y = 112.3i=1i=1%x y -5xyzp 曰 7 i i112.3

17、 - 5 x 4 x 5于是 b = = 1.23,%厂290 - 5 x 42Lx2 - 5x2i_ i =1a = y - bx = 5 -1.23 x 4 = 0.08。.线性回归方程为:y = bx + a = 1.23x + 0.08。(2)当 x=10 时,9 = 1.23 x 10 + 0.08 = 12.38 (万元)即估计使用10年时维修费用是12.38万元。点评:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备 线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也 是不可信的。四、【巩固练习】

18、D )C.总体标准差D.总体样本1. 下面哪有个数不为总体特征数的是(A. 总体平均数B.总体方差答案:D2.设随机变量&服从二项分布3B.165A.16答案:A3. 设随机变量gN (”A.0B.O5C.8(6, 1 ),则 P ( & =3 ) = (A)3D.8且 P (& WC) =P (g C),贝0 C 等于C.D.”解析:由正态曲线的图象关于直线x=”对称可得答案为D.答案:D且 Eg =3, Dg =1,则 P ( 1g W1)等于B.0 (4)0 (2)D.0 (4)0 (2)o 2=Dg =1,故 P (1g W1) =0 (13)0 (13) =0 (2)4. 如果随机变

19、量gN (”,O 2),A.20 (1)1C.0 (2)0 (4)解析:对正态分布,” =Eg =3 0 (4) =0 (4)0 (2).答案:B5. 某厂生产的零件外直径gN (8.0,1.52) (mm),今从该厂上、下午生产的零件中各随机取出一个,测得其 外直径分别为7.9 mm和7.5 mm,则可认为A. 上、下午生产情况均为正常B. 上、下午生产情况均为异常下午生产情况异常下午生产情况正常在8+3X1.5=8.45 (mm)与 83X1.5=7.55 (mm)之外时为异常C. 上午生产情况正常D. 上午生产情况异常解析:根据30原则,答案:C6. 随机变量g服从正态分布N (0,1)

20、,如果P (g 1) =0.8413,求P ( 1g 0).解:.& N (0,1),P ( 1g 0) =P (0g 0.99.7查表得X173 2.33,x189.31,即公共汽车门的高度应设计为190 cm,可确保99%以上的成年男子 7头部不跟车门顶部碰撞.8.一投资者在两个投资方案中选择一个,这两个投资方案的利润x (万元)分别服从正态分布N (8, 32)和N(6, 22),投资者要求利润超过5万元的概率尽量地大,那么他应选择哪一个方案?解:对第一个方案,有xN (8, 32),,5 8、于是 P (x5) =1-P (xW5) =1-F (5) =1-0 ( 58 ) 3=1 0

21、 ( 1) =1 1 0 (1) =0 (1) =0.8413.对第二个方案,有xN (6, 22),于是 P (x5) =1P (xW5) =1F (5) =1 0 ( 56 ) 2=1 0 (0.5) =0 (0.5) =0.6915.相比之下,“利润超过5万元”的概率以第一个方案为好,可选第一个方案.9.为考虑广告费用x与销售额j之间的关系,抽取了 5家餐厅,得到如下数据:广告费用(千元)1.04.06.010.014.0销售额(千元)19.044.040.052.053.0现要使销售额达到6万元,则需广告费用为(保留两位有效数字)解析:先求出回归方程y =bx+a,令J =6,得x=1

22、.5万元.答案:1.5万元10. 设随机变量服从N (0,1),求下列各式的值:(1) P( 32.55);(2) P( -1.44);(3) P(| 11.52)。分析:一个随机变量若服从标准正态分布,可以借助于标准正态分布表,查出其值。但在标准正态分布表中 只给出了 x0 2。,即P(x ”=4 (x0)的情形,对于其它情形一般用公式: (-x)=1w (x); p(ax x= 1 P(x 2.55) = 1 P(8 2.55)二 14 (2.55) = 1 0.9946 = 0.0054;(2) P(8 1.44) =4(1.44) = 1 4(1.44)=1 0.9251 = 0.07

23、49 ;(3) P(|8 | 1.52) = P(1.528 0的概率,就可以利用上述三个公式求出其它情 0形下的概率。11. 某厂生产的圆柱形零件的外径N (4, 0.25)。质检人员从该厂生产的1000件零件中随机抽查一件,测 得它的外径为5.7cm。试问该厂生产的这批零件是否合格?分析:欲判定这批零件是否合格,由假设检验基本思想可知,关键是看随机抽查的一件产品的尺寸是在(|J -3a , p +3a )内,还是在(p -3o , p +3a )之外。解:由于圆柱形零件的外径N (4, 0.25),由正态分布的特征可知,正态分布N (4, 0.25)在区间(4-3X0.5, 4+3X0.5

24、)即(2.5, 5.5)之外取值的概率只有 0.003,而 5.7 冬(2.5,5.5),这说明在一次试验中,出现了几乎不可能发生的小概率事件,根据统计中假设检验的基本思想,认为该厂这批产品是不合格的。点评:判断某批产品是否合格,主要运用统计中假设检验的基本思想。五、【课堂总结】小结:1.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率 分布直方图就会演变成一条光滑曲线一一反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关 系,且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个样本,用样本的频率分布去估 计相应的总体分布.2. 统计中假设检验的基本思想是:根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!