粒子物理与核物理实验中的数据分析.ppt

上传人:优*** 文档编号:138566850 上传时间:2022-08-21 格式:PPT 页数:40 大小:1.18MB
收藏 版权申诉 举报 下载
粒子物理与核物理实验中的数据分析.ppt_第1页
第1页 / 共40页
粒子物理与核物理实验中的数据分析.ppt_第2页
第2页 / 共40页
粒子物理与核物理实验中的数据分析.ppt_第3页
第3页 / 共40页
资源描述:

《粒子物理与核物理实验中的数据分析.ppt》由会员分享,可在线阅读,更多相关《粒子物理与核物理实验中的数据分析.ppt(40页珍藏版)》请在装配图网上搜索。

1、8/12/20221粒子物理与核物理实验中的粒子物理与核物理实验中的数据分析数据分析杨振伟杨振伟清华大学清华大学第二讲:基本概念(续)第二讲:基本概念(续)8/12/20222艾滋病检验结果再认识艾滋病检验结果再认识()0.001 ()()0.032 ()P AIDSP AIDS 验前概率前概率验后概率后概率 对于个人而言,对于个人而言,0.032 是主观概率。如果没有是主观概率。如果没有其它额外的信息时,应把其它额外的信息时,应把 0.001 当作相对频率解释。当作相对频率解释。但是往往在病毒检验前,该相对频率被当作一种信但是往往在病毒检验前,该相对频率被当作一种信念来处理个人是否患病。念来

2、处理个人是否患病。如果还有其它额外的信息,应该给出不同的先如果还有其它额外的信息,应该给出不同的先验概率。这种贝叶斯统计的特点必定是主观的。例验概率。这种贝叶斯统计的特点必定是主观的。例如,受检者有过吸毒历史。一旦验前概率改变,贝如,受检者有过吸毒历史。一旦验前概率改变,贝叶斯定理就会告诉患病的可能性。对阳性结果的诠叶斯定理就会告诉患病的可能性。对阳性结果的诠释就会改变。释就会改变。问题:能否构造含自变量的概率?问题:能否构造含自变量的概率?8/12/20223随机变量与概率密度函数随机变量与概率密度函数假设实验结果为假设实验结果为 x (记作样本空间中元素记作样本空间中元素)的概率为的概率为

3、(,)()Pxx xdxf x dx观测到到在在范范围内内那么概率密度函数那么概率密度函数 p.d.f.定义为定义为 f(x),它对全部样本空间,它对全部样本空间S 满足满足()1Sf x dx 定义累积分布函数为定义累积分布函数为()()xF xf x dx 对于离散型随机变量对于离散型随机变量1(),1,()()iniiiiixxfP xfF xP x)(xf)(xFxx8/12/20224 分位数、中值与模分位数、中值与模分位分位点点 x 定义为随机变量定义为随机变量 x 的值,它使得的值,它使得()F x 这里这里 0 1。因此可以容易求出分位点。因此可以容易求出分位点1()xF 随机

4、变量随机变量 x 的的中值中值定义为定义为 11/2(1/2)xF 随机变量随机变量 x 被观测到大于或小于中值的概率是相等的。被观测到大于或小于中值的概率是相等的。模模定义为使概率密度函数值达到极大的随机变量值。定义为使概率密度函数值达到极大的随机变量值。8/12/20225直方图与概率密度函数直方图与概率密度函数概率密度函数概率密度函数 p.d.f.就是拥有无穷大样本,区间宽度为零,就是拥有无穷大样本,区间宽度为零,而且归一化到单位面积的而且归一化到单位面积的直方图直方图。()()()()N xf xn xN xnx 每每个个区区间的事的事例例数数 频数数填入填入直直方方图的的总事事例例数

5、数区区间的的宽度度)(xN)(xN)(xN)(xfxxxx直方图在统计分析中非常重直方图在统计分析中非常重要,应准确理解它的含义。要,应准确理解它的含义。8/12/20226多变量情形多变量情形如果观测量大于一个,例如如果观测量大于一个,例如 x 与与 y()(,)(,)p.d.f.(,)1P ABf x y dxdyf x yf x y dxdy 联合合的的8/12/20227边缘分布边缘分布将联合概率密度函数将联合概率密度函数 p.d.f.分别投影到分别投影到 x 与与 y 轴轴y)(yfyx)(xfxyx()(,)y()(,)(),()p.d.f.xyxyxfxf x y dyfyf x

6、 y dxfxfy 投投影到影到轴:投投影到影到边缘的的轴:定定义:8/12/20228若若 x,y 相互独立,则可构造相互独立,则可构造2-维维p.d.f条件概率密度函数条件概率密度函数利用条件概率的定义,可得到利用条件概率的定义,可得到dxxfdxdyyxfAPBAPABPx)(),()()()|(定义条件概率的密度函数定义条件概率的密度函数 p.d.f.为为)(),()|(,)(),()|(yfyxfyxg xfyxfxyhyx则贝叶斯定理可写为则贝叶斯定理可写为)()()|()|(yfxfxyhyxgyx)()(),(yfxfyxfyx h(y|x)yyxdxdx8/12/20229名

7、词总汇名词总汇随机事例随机事例概率概率条件概率条件概率相对频率与主观概率相对频率与主观概率贝叶斯定理贝叶斯定理随机变量随机变量概率密度函数概率密度函数条件密度函数条件密度函数直方图直方图8/12/202210问题问题()(|)()P ABP A BP B条件概率条件概率如果如果 A 与与 B 相互独立相互独立,则从文恩图上得到,则从文恩图上得到0AB因此因此 ()(|()0)()0?()P ABP A BPBPAAPB8/12/202211解答:概率都是条件概率解答:概率都是条件概率由柯尓莫哥洛夫公理,我们定义了概率由柯尓莫哥洛夫公理,我们定义了概率 P(A)。但在实际应用中,我们总是对但在实

8、际应用中,我们总是对 A 相对于许多样本空间的概率相对于许多样本空间的概率感兴趣,而不仅仅只是一个空间。因此,通常以记号感兴趣,而不仅仅只是一个空间。因此,通常以记号(|)P A S来表示所进行的研究是在特定的样本空间来表示所进行的研究是在特定的样本空间 S 中,也就是中,也就是 A 相相对于对于 S 的条件概率。的条件概率。因此,所有概率在实际应用中都是因此,所有概率在实际应用中都是条件概率条件概率。只有当只有当 S 的选择是明白无误时,才能简单记为的选择是明白无误时,才能简单记为(|)P A S()P A8/12/202212解答:互斥与相互独立解答:互斥与相互独立互斥互斥的定义为的定义为

9、ABAB也就是两个事例的定义没有交集。所给出的推论为也就是两个事例的定义没有交集。所给出的推论为0()()()ABP ABP AP B相互独立相互独立的定义为的定义为 ()()()P ABP A P BAB如果则与相互独立。因此,根据定义两个相互独立的事例不意味着是互斥的。前因此,根据定义两个相互独立的事例不意味着是互斥的。前面的问题属于把两者定义混淆了。面的问题属于把两者定义混淆了。8/12/202213证明举例:事例与逆事例证明举例:事例与逆事例如果 A 是在 S 中的任意一个事例,则()1()P AP A证明:由于 A 与 根据定义是互斥的,并且从文恩图得到AAAS因此可以写出()()(

10、)()1P AP AP AAP S()1()P AP A8/12/202214举例:检查给定概率的合理性举例:检查给定概率的合理性如果一个实验有三种可能并且互斥的结果 A,B 和 C,检查下列各种情况给出的概率值是否是合理的:1)()1/3,()1/3,()1/32)()0.64,()0.38,()0.023)()0.35,()0.52,()0.264)()0.57,()0.24,()0.19P AP BP CP AP BP CP AP BP CP AP BP C 结论:只有结论:只有1)与)与4)是合理的。)是合理的。评论:作为一个合格的实验研究人员,一定要具备判断评论:作为一个合格的实验研

11、究人员,一定要具备判断 结果是否合理的能力!结果是否合理的能力!8/12/202215举例:检查经验概率密度函数举例:检查经验概率密度函数221)()1,2,3,422)()0,1,2,3,425xf xxxh xx对于对于实验上经常经验性地从直方图中给出概率密度函数(例如通过拟合直方图分布等等),但是需要确定得到的函数是否满足概率密度函数的定义,例如试判断哪一个可以用作概率密度函数?答案:1)有负概率值;2)累积函数值大于1。因此,两者在给定的随机变量范围内都不能用作概率密度函数。8/12/202216数据分析中的问题数据分析中的问题粒子与核物理实验中对动量的测量通常是分别测量粒子与核物理实

12、验中对动量的测量通常是分别测量xypzp在已知两分量测量值的概率密度函数情况下,总动量为在已知两分量测量值的概率密度函数情况下,总动量为如何导出总动量的测量值的概率密度函数?如何导出总动量的测量值的概率密度函数?22xyzppp(,)xyzf pp()g p是研究随机变量函数的是研究随机变量函数的p.d.f问题。问题。8/12/202217一维随机变量的函数一维随机变量的函数随机变量的函数自身也是一个随机变量。随机变量的函数自身也是一个随机变量。假设假设 x 服从服从 p.d.f.f(x),对于函数对于函数 a(x),其,其p.d.f.g(a)为何?为何?()()()()()(),()()()

13、()()dSx a dax adxx adadax ag a daf x dxdSaa adaxg a daf x dxf x dxdxg af x ada 在在内内的的 空空间间范范围围cos:与例如8/12/202218函数的逆不唯一情况函数的逆不唯一情况假如假如 a(x)的逆不唯一,则函数的的逆不唯一,则函数的 p.d.f.应将应将 dS 中对应于中对应于 da 的所有的所有 dx 的区间包括进来的区间包括进来2:,2()(),22()()()22dSdaaxxadxag a daf x dxdadadSaaaaaafafag aaa 例例如如8/12/202219多维随机变量的函数多维

14、随机变量的函数考虑随机矢量考虑随机矢量 与函数与函数 ,对应的,对应的 p.d.f.),.,(1nxxx)(xa11()(,.,).()()nndSg a daf xx dxdxdSa xaa xadax 在在与与定定义义的的曲曲面面空空间间范范围围如果两个独立变量如果两个独立变量 x 与与 y,分别按,分别按 g(x)与与 h(y)分布,那么分布,那么函数函数 z=xy 应具有何种形式?应具有何种形式?(,)()()f x yg x h y()/|/|()(,)()()()()dSdSz dzxz xf z dzf x y dxdyg x h y dxdyg x dxh y dy 8/12/

15、202220多维随机变量的函数多维随机变量的函数(续一续一)()()()()()|zdxzdyf zg x hgh yxxyy fgh记作记作 g 与与 h 的的Mellin卷积卷积如果函数为如果函数为 z=x+y,则应具有何种形式?,则应具有何种形式?()()()()()f zg x h zx dxg zy h y dy fgh记作记作 g 与与 h 的傅立叶卷积的傅立叶卷积注意:通常将两者皆称为注意:通常将两者皆称为 g 与与 h 的卷积的卷积,已相同记号表示。,已相同记号表示。8/12/202221多维随机变量的函数多维随机变量的函数(续二续二)考虑具有联合的考虑具有联合的 p.d.f.

16、的随机矢量的随机矢量 ,构造,构造 个线性独立的函数:个线性独立的函数:,而且其逆,而且其逆函数函数 存在。那么存在。那么 的联合的联合 p.d.f.为为1(,.,)nxxx n1()(),.,()na xaxax 1(),.,()nx ax aa()()g aJ f x 这里这里 是雅可比行列式是雅可比行列式J1111222212nnnnxxxaaaxxxaaaJxa 任意一个函数任意一个函数均可通过对函数均可通过对函数积分掉其它不用的变积分掉其它不用的变量而得到。是数据处量而得到。是数据处理中误差传递的基础。理中误差传递的基础。()iig a()g a 8/12/202222期待值期待值考

17、虑具有考虑具有 p.d.f.的随机变量的随机变量 ,定义,定义期待期待(平均平均)值为值为)(xfxdxxfxxE)(注意注意:它不是它不是 的函数,而是的函数,而是 的一个参数。的一个参数。x)(xf通常记为:通常记为:xE对对离散型离散型变量,有变量,有niiixPxxE1)(对具有对具有 p.d.f.的函数的函数 ,有,有)(xy)(ygdxxfxydyyygyE)()()(方差方差定义为定义为222)(xExExExV通常记为:通常记为:2xV标准偏差标准偏差:28/12/202223协方差与相关系数协方差与相关系数定义定义协方差协方差 (也可用矩阵表示也可用矩阵表示 )为为,covy

18、xxyVyxyxxyEyxEyx)(,cov相关系数相关系数定义为定义为 11 ,covxyyxxyyx如果如果 x,y 独立,即独立,即)()(),(yfxfyxfyx则则 0,covyx8/12/202224举例:样本平均值举例:样本平均值假设实验上研究一核素衰变寿命,在探测效率为100%的情况下,每次探测到的寿命为 ti,一共测量了 n 次,求平均寿命(也就是寿命的期待值)。根据离散型期待值的定义1()niiiE tt P t问题的关键是 ti 的概率密度函数是什么?根据概率的相对频率定义,在 n 次测量中出现 ti 频率为一次1()iP tn因此,期待值(或平均寿命)为1111 nni

19、iiiE tttnn思考:如果频率为 mi 次,结果会不同吗?8/12/202225误差传递误差传递),.,(1nxxx 假设假设 服从某一联合服从某一联合 p.d.f.,我们也许并不我们也许并不全部知道该函数形式全部知道该函数形式,但假设我们有协方差,但假设我们有协方差)(xf,covjiijxxV 和平均值和平均值 xE现考虑一函数现考虑一函数 ,方差,方差 是什么?是什么?)(xy22)(yEyEyV将将 在在 附近按附近按泰勒展开泰勒展开到第一级到第一级)(xy)()()(1iixniixxyyxy然后,计算然后,计算 与与 yE2yE8/12/202226误差传递误差传递(续一续一)

20、由于由于0iixE所以利用泰勒展开式可求所以利用泰勒展开式可求)()(yxyEijxnjijinjjjxjniiixiiixniiVxyxyyxxyxxyExExyyyxyE1,211122)()()()(2)()(8/12/202227误差传递误差传递(续二续二)两项合起来给出两项合起来给出 的方差的方差)(xy2,1 nyiji jijxyyV yVxx如果如果 之间是无关的,则之间是无关的,则 ,那么上式变为,那么上式变为ixijiijV22221 nyiiixyV yx类似地,对于类似地,对于 组函数组函数m)(),.,()(1xyxyxym8/12/202228误差传递误差传递(续三

21、续三)ijxnjijliklkklVxyxyyyU1,cov或者记为矩阵形式或者记为矩阵形式xjiijTxyAAVAU ,)(xy注意:上式只对注意:上式只对 为线性时是精确的,近似程度在函数非为线性时是精确的,近似程度在函数非线性区变化比线性区变化比 要大时遭到很大的破坏。另外,上式并不需要大时遭到很大的破坏。另外,上式并不需要知道要知道 的的 p.d.f.具体形式,例如,它可以不是高斯的。具体形式,例如,它可以不是高斯的。iix8/12/202229误差传递的一些特殊情况误差传递的一些特殊情况,cov2212221221xxxxyy2121222221212221,cov2xxxxxxyx

22、xyy注意在相关的情况下,最终的误差会有很大的改变,例如当注意在相关的情况下,最终的误差会有很大的改变,例如当1 ,10 ,212121xxy0 ,0211 ,0 :14.1 ,211 ,0 :022212221yyyVyEyVyE这种特征有时候是有益的:将公共的或难以估计的误差,这种特征有时候是有益的:将公共的或难以估计的误差,通过适当的数学处理将它们消掉,达到减小误差的目的。通过适当的数学处理将它们消掉,达到减小误差的目的。8/12/202230坐标变换下的误差矩阵坐标变换下的误差矩阵实验上经常通过测量粒子在探测器中各点的击中坐标实验上经常通过测量粒子在探测器中各点的击中坐标(x,y)来拟

23、合在极坐标下的径迹来拟合在极坐标下的径迹(r,)。通常情况下,通常情况下,(x,y)的的测量是不关联的。测量是不关联的。222tan/rxyy x (,)(,)TU rAV x y A 由于由于因此,坐标变换后的误差矩阵为因此,坐标变换后的误差矩阵为2222222222222222222222()0cov(,)101cov(,)()()xyyxxryyxxyxyxyxyxyrrrrrryxyxrxyryxrrrrrr 8/12/202231大亚湾反应堆中微子实验大亚湾反应堆中微子实验8/12/2022321r2r1S2S反应堆中微子反应堆中微子n反应堆能产生大量反电子型中微子3 GW 热功率反

24、应堆206 10个反电子中微子/秒n中微子几乎无损穿透物质假设产生的中微子以球面波传播,那么在任一地方任一给定面元的中微子流强为24rSIIrenpe 8/12/202233大亚湾中微子振荡大亚湾中微子振荡n中微子振荡中微子在运动过程中自己不断改变形态n测量中微子形态随运动距离的改变1214rSIIr2224rSIIrn中微子形态随运动距离的改变理论预言2132()4(,sin)4reeSII PrSIfmr 截面效率8/12/202234如何保证如何保证1%精度?精度?n测量中微子振荡的影响2112rIII方案:方案:那一种方案更易实现那一种方案更易实现1%精度的测量?为什么?精度的测量?为

25、什么?132(,sin)4rSII fmr 截面效率8/12/202235不同坐标系下相关性的变化不同坐标系下相关性的变化通过转动坐标,随机变量的相关性会发生改变。通过转动坐标,随机变量的相关性会发生改变。xyx y 显然,通过将坐标系转动显然,通过将坐标系转动 450,上面的相关性在新坐标系下,上面的相关性在新坐标系下消失。消失。8/12/202236随机变量作正则变换去除相关性随机变量作正则变换去除相关性对应的协方差矩阵为对应的协方差矩阵为11,1,1cov,cov,cov,ijijnnikkjllkknikjlklk lnTikklljk lUyyA xA xA AxxA V A ,1c

26、ov,klklnkliji jijxUyyyyVxx 非线性情况非线性情况1niijjjyA x 假设有假设有 n 个随机变量个随机变量 x1,xn 以及协方差矩阵以及协方差矩阵Vij=covxi,xj,可以证明有可能通过可以证明有可能通过线性变换线性变换重新定义重新定义 n 个新的变量个新的变量 y1,yn 使得对应的协方差矩阵使得对应的协方差矩阵Uij=covyi,yj非对角元为零。令非对角元为零。令8/12/202237变换后的变量协方差矩阵对角化变换后的变量协方差矩阵对角化为了使协方差矩阵为了使协方差矩阵 U 对角化对角化TUAVA iiiiikl li kVrrV rr 或或由于协方

27、差矩阵总是对称的,因此可知本征矢量是正交的由于协方差矩阵总是对称的,因此可知本征矢量是正交的1nijijk kijkrrr r 11 nniTjTikikijjijiijjkjjikjjArArA Ar rrr ,可先确定协方差矩阵可先确定协方差矩阵 V 的本征列矢量的本征列矢量 ,i=1,n。解方程解方程ir 变换矩阵变换矩阵 A 由本征矢量由本征矢量 给出,即给出,即r 8/12/202238正则变换后变量的协方差矩阵正则变换后变量的协方差矩阵因此,正则变换的协方差矩阵为因此,正则变换的协方差矩阵为,1,11nTijikklljk lnijkkl lk lnijkj kkijjjijUA

28、V Ar V rrrrr 变量作正则变换变量作正则变换后,其方差由原后,其方差由原协方差矩阵协方差矩阵 V 的的本征值给出。本征值给出。对应于矢量的转动对应于矢量的转动不改变模的大小。不改变模的大小。|y|2=yTy=xTATAx=|x|2尽管非关联变量经常容易尽管非关联变量经常容易处理,但是对经过变换的处理,但是对经过变换的变量的理解不一定容易。变量的理解不一定容易。8/12/202239带电粒子在闪烁体的射程带电粒子在闪烁体的射程在原来的定义下,可以得到在原来的定义下,可以得到粒子射程随动量大小的变化粒子射程随动量大小的变化关系。通过转动变换,粒子关系。通过转动变换,粒子的射程与动量发生了

29、改变,的射程与动量发生了改变,无物理含义,但是提供了一无物理含义,但是提供了一个很好的粒子类型甄别变量。个很好的粒子类型甄别变量。8/12/202240小结小结概率概率随机变量随机变量随机变量函数随机变量函数误差传递误差传递定义:柯尔莫哥洛夫公理定义:柯尔莫哥洛夫公理+条件概率条件概率解释:频率或信心程度解释:频率或信心程度贝叶斯定理贝叶斯定理概率密度函数概率密度函数 p.d.f.累积分布函数累积分布函数联合,边缘与条件的联合,边缘与条件的 p.d.f.函数自身也是随机变量函数自身也是随机变量 几种方法找出几种方法找出 p.d.f.函数方差的计算方法是基于一阶泰勒展开,只对线性方程精确。函数方差的计算方法是基于一阶泰勒展开,只对线性方程精确。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!