几种常见的分布

上传人:痛*** 文档编号:189111721 上传时间:2023-02-21 格式:PDF 页数:11 大小:1.01MB
收藏 版权申诉 举报 下载
几种常见的分布_第1页
第1页 / 共11页
几种常见的分布_第2页
第2页 / 共11页
几种常见的分布_第3页
第3页 / 共11页
资源描述:

《几种常见的分布》由会员分享,可在线阅读,更多相关《几种常见的分布(11页珍藏版)》请在装配图网上搜索。

1、.一、常见数据类型 在正式的解释分布之前,我们先来看一看平时遇到的数据。数据可大致分为离散型数据和连续型数据。离散型数据 离散型数据顾名思义就是只取几个特定的值。例如:当你掷骰子的时候,结果只有 1,2,3,4,5,6,不会出现类似 1.5,2.5。连续型数据 在一个给定的范围内,连续型数据可以取任意值。这个范围可以是有限的或者是无穷的。例如:一个人的体重或者身高,可以取值 54kg,54.4kg,54.33333kg 等等都没有问题。下面就开始介绍分布的类型。二、分布类型 伯努利分布(Bernoulli Distribution)首先从最简单的分布开始,伯努利分布实际上是一个听起来最容易理解

2、的分布。伯努利分布一次实验有两个可能的结果,比如 1 代表 success 及 0 代表 failure。随机变量XX 一个取值为 1 并代表成功,成功概率为pp,一个取值为 0 表示失败,失败概率为qq 或者说1p1p。这里,概率分布函数为px(1p)1xpx(1p)1x,其中x(0,1)x(0,1),我们也可以写成如下形式:P(x)=1p,p,x=0 x=1P(x)=1p,x=0p,x=1 成功和失败的概率没必要相同,也就是没必要都是 0.5,但是这俩概率加和应该为 1,比如可以是下面的图:.这个图就是p(success)=0.15,p(failure)=0.85p(success)=0.

3、15,p(failure)=0.85。下面说一下随机变量的期望,一个分布的期望就是这个分布的均值。服从伯努利分布的随机变量XX 的期望值就是:E(X)=1p+0(1p)=pE(X)=1p+0(1p)=p 服从伯努利分布的随机变量的方差是:V(X)=E(X2)E(X)2=pp2=p(1p)V(X)=E(X2)E(X)2=pp2=p(1p)还有许多伯努利分布的例子,比如说明天是否会下雨,今天会不会去健身,明天乒乓球比赛是不是会赢。均匀分布(Uniform Distribution)当你掷骰子的时候,结果出现 1 到 6 中的任何一个,而任何一个结果出现的概率都是相同的,这就是均匀分布最原始的雏形。

4、你可能看出来了,与伯努利分布不同的是,这nn 个出现的结果的概率都是相同的。一个随机变量XX 为均匀分布是指密度函数如下:f(x)=1baabf(x)=1baabE(X)=(a+b)2E(X)=(a+b)2 Variance-V(X)=(ba)212V(X)=(ba)212 标准的均匀分布的密度参数为a=0a=0 和b=0b=0,所以对于标准的均匀分布的密度函数为:f(x)=1,0,0 x1otherwisef(x)=1,0 x10,otherwise 二项分布(Binomial Distribution).我们假定一个随机变量,比如XX,表示你赢得比赛的次数。XX 可能的值是什么?它可以是任

5、何数字,赢得比赛的次数。如果就两个可能的结果。成功,失败。因此,成功概率=0.5,失败的概率可以容易地计算为:q=p1=0.5q=p1=0.5。只有两种结果是可能的分布,如成功或失败,以及所有试验的成功和失败概率相同的情况称为二项分布。发生结果的可能性不同时,前面的例子如果实验成功的概率是 0.2,那么失败的概率可以很容易地计算出来,q=10.2=0.8q=10.2=0.8。每次试验都是独立的,因为之前的结果并不决定或影响当前的结果。只有两次重复 n 次的可能结果的实验称为二项式。二项分布的参数是nn 和pp,其中nn 是试验的总数,pp 是每个试验中成功的概率。基于上述解释,二项分布的性质是

6、:1.每次实验独立 2.试验中只有两种可能的结果-成功或失败。3.共进行了nn 次相同的试验。4.所有试验的成功和失败的概率是相同的。(试验是相同的。)二项分布的数学表达式由下式给出:P(x)=n!(nx)!x!pxqnxP(x)=n!(nx)!x!pxqnx 一个二项分布图,其中成功的概率不等于失败的概率长这样:.成功概率与失败概率相等,长这样:二项分布均值和方差:Mean-=np=np Variance-Var(X)=npqVar(X)=npq 正态分布(Normal Distribution)正态分布可以表示宇宙中大多数的事件发生情况。如果任何分布具有以下特征,则称为正态分布:1.均值、

7、中位数、众数在一个分布中取相同的值;2.分布曲线关于x=x=对称;.3.曲线下面的面积总和为;4.中心位置的左半边和右半边对应位置的概率取值相同。正态分布与二项分布有很大的不同。但是,如果试验次数接近无穷大,则形状将非常相似。服从正态分布的随机变量XX 的密度函数为:f(x)=12e12(x)2xf(x)=12e12(x)2x E(X)=E(X)=Variance-Var(X)=2Var(X)=2 这里(mean)和(standard deviation)是两个参数,随机变量XN(,)XN(,)的不同取值的变化图如下:标准正态分布的均值为 0,方差为 1,密度图如下:f(x)=12ex22xf

8、(x)=12ex22x E(X)=E(X)=Variance-Var(X)=Var(X)=指数分布(Exponential Distribution)我们再来考虑一下呼叫中心的例子。想想通话间的时间间隔是多少?指数分布来解决我们的问题。指数分布对呼叫之间的时间间隔建模。其他例子:1.两站地铁到达之间的时间长度 2.到达加油站的时间长度 3.空调的使用寿命 指数分布广泛用于生存分析。从机器的预期寿命到人的预期寿命,指数分布可用来传递这些结果。随机变量XX 服从指数分布,它的 PDF 为:f(x)=ex,x0f(x)=ex,x0 参数00 也叫做速率。对于生存分析,被称为设备在任何时间tt 的故障

9、率,假设它存活到 t。服从指数分布的随机变量XX 的均值和方差:Mean-E(X)=1E(X)=1 Variance-Var(X)=(1)2Var(X)=(1)2 此外,速率越大,曲线越下降快,速率越低,曲线越平滑。下图显示了这一点:.为了简化计算,下面给出了一些公式。PXx=1exPXx=1ex 对应于xx 左边密度曲线下的面积。PXx=1exPXx=1ex 对应于xx 右侧密度曲线下的面积。Px1Xx2=ex1ex2Px1 .2.每次试验成功的概率相同,无穷小或者pp-0 3.np=np=,有限。正态分布和二项分布&正态分布和泊松分布 正态分布是在以下条件下二项分布的另一种极限形式,条件如下:1.试验次数无限大nn-2.pp 和qq 都不是无限小的。正态分布也是参数-的泊松分布的一个极限情况。指数分布和泊松分布 如果随机事件之间的时间遵循速率为 的指数分布,那么长度为tt 的时间段内的事件总数遵循具有参数tt 的泊松分布。总结 概率分布在许多领域都很普遍,即保险学,物理学,工程学,计算机科学甚至社会科学,其中心理学和医学学生广泛使用概率分布。它有一个简单的应用程序和广泛的使用。这篇文章强调了在日常生活中观察到的六个重要分布,并解释了它们的应用。现在你将能够识别,关联和区分这些分布。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!