信息论论文

上传人:zou****hua 文档编号:185804503 上传时间:2023-02-06 格式:DOCX 页数:7 大小:21.39KB
收藏 版权申诉 举报 下载
信息论论文_第1页
第1页 / 共7页
信息论论文_第2页
第2页 / 共7页
信息论论文_第3页
第3页 / 共7页
资源描述:

《信息论论文》由会员分享,可在线阅读,更多相关《信息论论文(7页珍藏版)》请在装配图网上搜索。

1、信息论与编码题 目最大熵原理的合理性及其应用姓 名学 号院 系成 绩二o年十二月二十八日最大熵原理的合理性及其应用摘要:熵是源于物理学的基本概念,后来香农在信息论中引入了信息熵的概念,它在 统计物理中的成功使人们对熵的理论和应用有了广泛和高度的重视。最大熵原理是一种 在实际问题中已得到广泛应用的信息论方法。本文从信息熵的概念出发,对最大熵原理 做了简要介绍,并论述了最大熵原理的合理性,最后提及它在一些领域的应用,通过在 具体例子当中应用最大熵原理,展示该原理的适用场合,以期对最大熵原理及其应用有 更深刻的理解。关键词:熵;信息熵应用;最大熵原理;不适定性问题;1.概述科学技术的发展使人类跨入了

2、高度发展的信息化时代。在政治、军事、经济等各个 领域,信息的重要性不言而喻,有关信息理论的研究正越来越受到重视,信息论方法也逐渐 被广泛应用于各个领域。信息论一般指的是香农信息论,主要研究在信息可以度量的前提下如何有效地、可靠地、 安全地传递信息,涉及消息的信息量、消息的传输以及编码问题。1948年C.E.Shannon为解 决通信工程中不确定信息的编码和传输问题创立信息论,提出信息的统计定义和信息熵、互 信息概念,解决了信息的不确定性度量问题,并在此基础上对信息论的一系列理论和方法进 行了严格的推导和证明,使以信息论为基础的通信工程获得了巨大的发展。信息论从它诞生 的那时起就吸引了众多领域学

3、者的注意,他们竞相应用信息论的概念和方法去理解和解决本 领域中的问题。近年来,以不确定性信息为研究对象的信息论理论和方法在众多领域得到了 广泛应用,并取得了许多重要的研究成果。迄今为止,较为成熟的研究成果有:E.T.Jaynes 在1957年提出的最大熵原理的理论;S.K.Kullback在1959年首次提出后又为J.S.Shore等人 在1980年后发展了的鉴别信息及最小鉴别信息原理的理论;A.N.Kolmogorov在1956年提 出的关于信息量度定义的三种方法 概率法,组合法,计算法;A.N.Kolmogorov在1968 年阐明并为J.Chaitin在1987年系统发展了的关于算法信息

4、的理论。这些成果大大丰富了信 息理论的概念、方法和应用范围。在信息论中,最大熵的含义是最大的不确定性,它解决的一大类问题是在先验知识不充 分的条件下进行决策或推断等。熵方法在谱估计、图象滤波、图象重建、天文信号处理、专 家系统等中都有广泛的应用。最大熵原理在实际问题中的应用近年来一直在不断地发展。2信息熵的概念信息熵是将熵概念成功地扩展到信息科学领域。熵是描述客观事物无序性的参数,它最 早是由R.Clausius于1865年引入热力学中的一个物理概念,通常称之为热力学熵。后来 L.Boltzmann赋予熵统计意义上的解释,称之为统计热力学熵。1929年,匈牙利科学家Lszilard 首先提出了

5、熵与信息不确定性的关系,使信息科学引用熵的概念成为可能。1948年,贝尔 实验室的C. Shannon创立了信息论,熵的概念有了新的解释,香农认为信息是人们对事物 了解的不确定性的消除或减少,他把通讯过程中信源讯号的平均信息量称为信息熵,现在 一般称之为香农熵,实现了信息熵的实际应用,从此对信息熵的研究,随着信息科学的发展 而得到不断的发展。香农将随机变量X的信息熵定义为:H (X)=兰 p log pnnn=1式中,p为X = x的概率分布,n=1,2,,N;当对数底数取2时,信息熵的单位为 nnbit/sign;取自然对数时,单位为nat/sign;取常用对数时,单位为hart/sign。

6、它代表了信源 输出后每个消息所提供的平均信息量,或信源输出前的平均不确定度。信息熵的定义使随机 变量的不确定性得到了量度,使信息论得到了空前的发展。而且,信息熵具有的凸函数性质使得它特别适合作为优化问题中的目标函数,这同时也 为信息论概念和方法在除通信领域以外的其他领域内的应用提供了理论基础,拓宽了信息论 的应用范围。3.最大熵原理香农提出的信息熵的概念很好地解决了随机事件的不确定性程度的度量问题,但没有解 决随机事件的概率是如何进行分配的问题。设想有一个可观测的概率过程,其中的随机变量X取离散值x,x,x,如果从观测的结果知道了这个随机变量的均值、方差等特征12n值,怎样才能确定它取各离散值

7、的概率P,P,P呢? 一般地,满足可观测值的概率12n分配,可以有无限多组。那么究竟应当选哪一组呢?即在什么意义下,所选出的一组概率才 是最可能接近实际的呢?在项目决策实际中,有些随机事件不能直接计算其概率,也无法知 道其频率,通常只能取得与该随机事件(或随机变量)有关的一个或几个平均值,从理论上讲, 对于给定的随机变量,如何获取最为合适的一个分布呢?1957年,E.T.Jaynes在“信息论与统计力学”一文中,提出一个选择准则:“当根据部 分信息进行推理时,必须选择这样一组概率分配,它应具有最大的熵,并服从一切已知的信 息。这是我们能够做出的唯一的无偏分配;使用任何其它分配,就等于对原来没有

8、信息做了 随意假定”。换言之,在只掌握部分信息的情况下要对分布做出推断时,符合已知信息的概 率分布可能不止一个,而我们应该选取符合约束条件但熵值取最大的概率分布,这是我们可 以做出的唯一的不偏不倚的选择,任何其他的选择都意味着我们添加了其他的约束或假设, 这些约束或假设根据我们所掌握的信息是无法做出的E.T.Jaynes建立的这一统计推理准则, 被称为最大熵原理,或者极大熵准则。它为我们如何从满足约束条件的诸多相容分布中,挑 选“最佳”、“最合理”的分布提供了一个选择标准。尽管这个准则在性质上也有主观的一面, 但却是一个最“客观”的主观准则。因为,我们知道,熵定义的实际上是一个随机变量的不 确

9、定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其 行为做准确预测最困难。商值最大意味着添加的约束和假设最少,这时求出的分布是最自然、 偏差最小的。4最大商原理的合理性最大商方法对于构造概率密度函数来说,是一种有价值的方法。按照极大商准则,人们 应该挑选在一定约束下(常常是某些与随机变量有关的平均值)使得商(或条件商)能极大化的 那种分布作为选定的分布。使用这个准则,先验信息(已知数据)将构成求极值的问题的约束 条件。由最大商准则得到的概率分布称为最大商分布。应用最大商准则构造先验概率分布有如下优点:首先,最大商的解是最超然的,即在数 据不充分的情况下求解,解必须和

10、己知的数据相吻合,而又必须对未知的部分做出最少的假 定;其次,根据商集中原理,绝大部分可能状态都集中在最大商状态附近,因此,用最大商 法所做出的预测是相当准确的;第三,用最大商法求得的解满足一致性要求一不确定性的测 度(商)与试验步骤无关。最大商方法的这一宝贵性质来源于推导商函数的合成法则。用最大商准则设立先验分布的理论根据由S.A. Smith从数学上进行了证明,其思路是把 随机性决策问题作为对策问题看待,即自然界选择一状态的分布使期望损失极大,而决策人 选择一决策使此期望损失为极小,推导出在损失函数的集为适合特定条件的理想集的情况, 这个极小化极大解的确能导致一概率分布适合最大商准则。对最

11、大商原理提出的疑问主要有以下两个:(1)关于最大商原理所得解的客观性引起这一疑问的原因要追溯到香农对商的定义和解释。在那里,香农是从通信的角度提 出和讨论商和信息的,因此计算商和信息时所用的概率分布带有一定的主观性。而最大商原 理是用于对客观物理系统的某种实际分布的估计,那么这样得到的估计是否也带有主观性 呢?仔细分析最大商原理所针对的问题,就可以知道在这一问题中,商的确代表了人们对客 观物理系统中某种物理量概率分布的无知程度,它带有主观性。然而,在最大商原理下所给 出的解却完全是一个客观的量,因为这一解只与一组数学期望值有关,而这组数学期望值是 可以客观测量得到的,所以最大商原理给出的解完全

12、是一个客观量,没有主观的因素。(2)如何理解被最大商原理排除的其他满足约束条件的解最大商原理所给出的解是唯一的,而不适定问题原来的解不唯一,因此我们如何来理解 适合约束条件的其他解,它们在实际情况下会不会是真正的解呢?有关研究结果已经证明, 从概率的观点来看,商值远离最大商的可能解出现的机会非常小,或者从组合的观点来看, 商值远离最大商的组合种类在所有可能的组合中所占的比例很小。因此,最大商解是在给定 信息下可能做出的最可靠的解,它在绝大多数情况下会接近于真实解,因而最大商原理是一 种保险的策略。5最大商原理在实际中的应用在数学、物理、工程技术及其它领域中,常常要根据测量的数据,所给的条件或所

13、作的 假设求解。对于求解,通常关心三个问题:存在性、唯一性和稳定性。如果这三个要求中至 少有一个不满足,则认为是“不适定性问题”对于此类问题,最大商原理是有效方法之一。 譬如,地球物理学中利用地震勘探法确定地层构造,射电天文学中利用无线电干涉仪获取星 空图像,计算机层析术中利用扫描投影数据构造断层图像,语音识别和语音编码中根据语音 信号估计声道参数,图像处理中对散焦或目标位移造成的蜕化图像进行复原,雷达及声纳中 根据接收信号进行功率谱估计,数字通信中对信道畸变带来的符号间串扰进行盲目均衡等不 适定性问题的解决通常采用基于最大熵原理的最大熵估计法。“不适定问题”是求解时由于数据不完全或有噪声,或

14、两者兼有,使掌握的数据不足以 推求该问题的确定解,其中包括所测得的数据求解时所给定的条件或假设。在“不适定问题” 的所有的可行(可能)解中,应选其中熵值最大的一个解。因为熵最大意味着对由于数据不足 而作的人为假定(人为添加信息)最小,从而所获得的解是最合乎自然、最为超然、偏差最小 的。统计物理中一些有名的分布已被证明都是在若干类似上述的约束条件下使熵或微分熵最 大的分布。例如,统计力学中气体分子速度的分布是能量受约束下的最大熵分布,大气层空 气密度随高度的分布是在平均势能受约束下的最大熵分布等。从熵作为不确定程度的度量来 看,此时的解包含的主观成分最少,因而是最客观的。自1957年Jaynes

15、提出这一原理以来, 这一原理先后在统计力学、统计学、运输工程、排队论、计算机系统建模、系统仿真、生产 决策、股市分析等领域得到应用,特别是在信号处理领域,最大熵原理成为谱估计或图像复 原中的主要方法。5.1在水文水资源科学中水文水资源科学从本质上看,是一门有关水信息(采集、传输、整理、分析、研究) 的学科。现有的大量研究成果表明:最大熵原理在水系统频率分析、水文时间序列谱分析、 水文水质观测站网的布设评估、水模型的研建评价、水文预报与预测、水力学、河流地貌学、 水利风险分析及水环境工程等方面具有广泛的应用。在水系统中应用最大熵原理最多的是水文频率分析研究,推导水文随机变量的概率分布 和参数估计

16、两个方面7。在水文频率分析研究中,由于无法从概率论理论直接推导出水文 变量的先验分布,一般只能是依据观测数据,通过统计来推求近似的后验分布。然而水文变 量现有的观测数据十分有限,远不足以推求概率分布。这是一个典型的不适定性问题。1972 年,J.O.Sonuga首次将最大熵原理应用到水文频率分析中,推导了基于有限数据的小偏差的 正态分布以进行频率分析,只需均值和标准差作为先验信息。研究证明,基于最大熵原理推 导频率分布,人为偏差最小,所得的结果最客观,合乎自然。另一方面,由于导出的分布仅 有的参数是以约束方程组形式表达,得出的分布的函数形式是无限制的,也可对假定的有参 概率分布函数根据样本数据

17、作参数估计,若考虑到样本数据所含的可观的抽样误差,则参数 估计仍旧适用最大熵原理的不适定问题。另外,水文/气象时间序列分析经常遇到确定周期等问题,而谱分析方法具有低分辨率, 选择自相关函数最大时滞的主观性不足。最大熵谱分析则具有频谱短且光滑、分辨率高等独 特优势。1967年,J.P.Burg首次将最大熵原理用于频谱分析,利用信息论的观点提出了外推 方式:在观察时间内估计值等于观察值;在观察时间之外的取值不做任何假定,即保持最随 机、最不确定性,也就是使得熵为最大。从而得到一种新的非线性谱估计法,即最大熵谱分 析法。1980年,A.R.Rao等比较了谱分析中的几种新近发展的方法,表明最大熵谱分析

18、方法 在水文时间序列的分析中是非常有效的。总之,在水文水资源科学领域中的许多问题,最大熵原理是一种前景看好的解决问题的 新途径。5.2在投资项目风险分析中由于投资项目的未来与目前的预测不可能是完全一致的,因此对项目偏离预期目标的程 度和发生偏离的概率的分析是十分必要的,也是投资人在项目决策时最为关心的。通过对各 种投资项目风险分析技术的对比研究中得出结论,只有概率分析法能够直接用于定量描述各 种风险因素对投资项目评价指标的影响并得出评价指标的概率分布。但由于受解析法与蒙特 卡罗模拟技术本身局限的制约,其使用范围以及使用效果受到一定影响。为了弥补概率分析 方法在投资项目风险分析中的不足,结合前人

19、对熵的研究成果,一种新的风险分析方法一一 基于最大熵原理的投资项目风险分析越来越受到人们的重视,研究证明该风险分析方法具有 绝对的可行性和有效性。众所周知,风险是与不确定联系在一起的,由于信息熵是度量、处 理、分析系统不确定性的一个有效工具,风险决策中又存在众多不适定性问题,最大熵原理 在风险分析和风险管理领域中的应用具有广阔的天地。5.3在地震重现关系上的应用在地震危险性分析中,综合以往地震发生的信息所用的最普通方法是建立地震重现 关系。这个关系把震源的某一参数(如震级或烈度)与相应的地震发生次数联系起来。比如 说,已知某震源在过去五十年中地震发生的信息,要想归纳这信息,最常用的方法就是建立

20、其 重现关系。最大熵原理首先可用于推导地震发生的时间间隔的分布,其次通过计算各震级地 震次数、累加地震次数以及概率密度函数可以看出最大熵法都显著地与实际数据吻合得很 好,这一方法得到的重现关系是与现有信息完全一致的,因而是偏差最小的。5.4在灾害损失分析中的应用灾害是一种随机事件,它以最无序的方式在各地发生,意味着灾害熵达到了最大值,因 此可以用最大熵原理来确定一个地区一定时段内灾害损失系列的分布。研究结果表明,根据 最大熵原理估计的灾害损失概念明确,便于应用。因为一个地区未来灾害的发生有其重复性, 因而根据该区历史灾害损失系列估计的未来灾害损失是有资料基础的。但灾害发生的时间是 不确定的,灾

21、害损失的大小也是不确定的,而目前的认识和预测水平还相差较远。因此根据 现有资料,用最大熵理论来估计未来灾害损失是可行的,只要确定灾害的风险水平或抗灾能 力的大小,那么即可求出具有一定重现期的灾害损失。6结论熵原本是分子热力学的一个概念,是对在分子随机运动下所处状态的一种数量描述,以 后被引用到信息论,衡量从随机信号得到的信息量大小。早在20世纪著名物理学家爱因斯 坦曾将熵理论的地位概述为:“熵理论,对于整个科学来说是第一法则。”随着时间的推移, 人们对熵理论认识也在不断深入。最大熵原理指出,当我们需要对一个随机事件的概率分布 进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要做任

22、何主观假设。(不做主观假设这点很重要。)在这种情况下,概率分布最均匀,预测的风险最小。因为这 时概率分布的信息熵最大,所以人们称这种模型叫最大熵模型”。我们常说,不要把所有的 鸡蛋放在一个篮子里,其实就是最大熵原理的一个朴素的说法,因为当我们遇到不确定性时, 就要保留各种可能性。“最大熵模型”在实际中有着及其广泛的应用。7结束语在最近几年,信息论方法在其他领域的应用已获得很大的成功,,除通信、计算机、信 号处理和自动控制领域(电子信息领域)等外,还渗透到生物学、医学、生理学、气象学、 语言学、社会学和经济学等领域,如核糖核酸中的遗传密码、光学信息论等。作为一种信息 论方法,最大熵原理在诸多学科

23、日益突显出它的重要性。本文阐述了信息熵的概念以及最大熵原理,讨论了最大熵原理的合理性,最后着重介绍 了最大熵原理在实际中的应用,不过也只是选择了几个基本的有代表性的应用作为例子进行 介绍。关于熵的其他理论,例如:最小熵产生原理、最小叉熵原理以及它们的应用等本文并 未涉及,将在以后的学习中加以研究。参考文献:1 陈运.信息论与编码(第2版).北京:电子工业出版社,2007.2 曹雪虹,张宗橙.信息论与编码.北京:清华大学出版社,2004.3 李立萍,张明友.信息论导引.成都:电子科技大学出版社,2005.4 田宝玉.工程信息论.北京:北京邮电大学出版社,2004.朱雪龙.应用信息论基础.北京:清华大学出版社,2000.李建东,王永茂,胡林敏最大熵原理及其应用信息科学,4243.王 栋,朱元甡.最大熵原理在水文水资源科学中的应用.水科学进展,2001,12(3): 424430.董伟民等.最大熵原理在地震重现关系上的应用.地震工程与工程程动,1983, 3(4): 114.9 冯利华,李凤全.基于最大熵原理的灾害损失分析.数学的实践与认识,2005,35(8):7377.10 张明等.信息论方法在水资源系统工程中的应用.中国人口 资源与环境,2007, 17(2):7983.

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!