信息熵的介绍及应用

来源 :中国信息化·学术版 | 被引量 : 0次 | 上传用户:zhangnnnnnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】以信息论的概念及其应用探讨为目的,首先通过提出想要对“信息”这一概念进行量化的想法,介绍了“信息量”概念的提出以及完善到“信息熵”的过程,进而介绍了“信息熵”的概念,简述了信息论这一学科的启蒙和发展。通过一个友谊赛比赛结果的例子贯穿了文章前半部文,并且运用信息量以及信息熵的计算方法对结果进行了计算和比较;在文章后半部分提出了一个经典问题,首先给出了一个信息熵极值定理的证明,之后运用信息熵的理论给出了这一问题的解决方法。
  【关键词】信息 信息量 信息熵 不确定性 概率
  【中图分类号】C931.6【文献标识码】A【文章编号】1672-5158(2013)07-0512-02
  1、信息量化及信息熵的提出
  1.1 信息的量化
  通常情况下我们无法准确感知“信息”(Information)这个抽象词语。而能够被量化的事物永远比只能被抽象形容的事物更加容易被人们理解和接受。例如,“今天一场足球友谊赛的比分是巴西4:0德国”就比“今天巴西在决赛上大胜德国队”更加能引起听者的共鸣。由此可见,若“信息”这一抽象概念能够被量化,将十分有助于我们理解它的深刻含义。
  1.2 信息熵的提出
  依然以上述友谊赛为例,假设甲乙丙三人都是球迷,当天的球赛甲因为有事而没有看到,此时他向乙、丙二人询问结果。乙说:“球赛不是平局”。丙说:“巴西队赢了”。显然,乙所提供的信息只能帮助甲排除掉两队平局的情况,而丙提供的信息则帮助甲排除了“两队踢平”和“德国队胜”这两种情况,从而提供了比乙更多的信息。通过这个例子,丙因为帮甲缩小了可能的范围而提供了更多的信息。在数学上,我们把这称为消除“不确定性”(Uncertainty)。很显然,信息的量化过程极有可能与不确定性相关。
  1928年,R.V.L.哈特莱首先提出信息定量化的初步设想,他将消息数的对数定义为“信息量”(information content)。若信源有m种消息,且每个消息是以相等可能产生的,则该信源的信息量可表示为I=log m。至于为什么用对数作为信息量的计算,随后的香农(C.E.Shannon)在他的论文“通信的数学理论(A Mathematical Theory of Communication)”中给出了解释。
  事实上,R.V.L.哈特莱对信息量的定义过于理想化,因为在现实中,绝大多数的信源输出的消息都是随机的,即是说“信源有m种消息,且每个消息是以相等可能产生的”这种情况是极少存在的。直到1948年香农( C. E. Shannon)提出了“信息熵”(entropy of information)的概念,奠定了“信息论”这一新学科的基础,才完善了“信息量”的概念。
  2、香农的信息论理念
  2.1 香农对信息量化的完善
  香农(C.E. Shannon)信息论中,信息是用不确定性的量度定义的,这与本文最开始提到的直观例子相符合:一个消息的可能性愈小,其信息愈多;而消息的可能性愈大,则其信息愈少。事件出现的概率小,不确定性就越多,信息量就大,反之则少。同时香农(C.E.Shannon)认为:信源输出的消息是随机的。即在未收到消息之前,是不能肯定信源到底发送什么样的消息。而通信的目的也就是要使接收者在接收到消息后,尽可能多的解除接收者对信源所存在的疑义(不确定度),因此这个被解除的不定度实际上就是在通信中所要传送的信息量。香农(C.E. Shannon)亦给出了信息量的计算公式:
  其中,K是正常数。
  4、经典问题
  4.1 硬币验假问题叙述
  介绍过了信息的量化过程以及信息量和信息熵的概念后,我们先来看一例经典问题以及信息论的知识在其中的应用。
  在12枚硬币中,有一枚假硬币的重量和其它11枚不同,除此之外12枚硬币的各项质地包括外形、颜色等完全相同。在只有一架天平且没有砝码的情况下,问最少几次可以找出重量不同的硬币。
  4.2 问题分析
  首先我们注意到:不知道假硬币的重量较其它硬币是轻是重给这一问题增加了难度,此时每枚硬币都可能是假硬币而且既可能轻也可能重,故而对于哪一枚硬币是假硬币这一事件来说总共有12×1×2=24种可能性;
  而在每次称量硬币时,由于我们不知道假硬币是轻是重,所以无法通过天平的倾斜方向来判断假硬币的所在,所以会出现三种可能:
  x1:假硬币在天平左边
  x2:假硬币在天平右边
  由于次数为一非负整数概念,故至少需要三次可以找出假硬币。
  4.3.2 实际操作结果
  首先将12枚硬币编号1~12,同时每四枚一组命名为第一组、第二组和第三组。第一次称量第一组和第二组,若:
  (1)天平平衡,则:
  (2)天平不平衡,不妨设第一组比第二组重量轻(即是说如果假硬币在第一组中,则1234中有一枚较标准硬币会轻;反之就是5678中有一枚较标准硬币会重)
  当第二组比第一组重则情况与②相仿,不予赘述。
  结束语
  以上是对信息量以及信息熵的介绍和实际应用的一些讨论和研究,自信息量概念的提出到信息熵系统的完善,可以说是将信息论这门学科或者说信息这一概念完整而系统的表示出来了,使人们对“信息”的概念和作用都有了深刻的认识,在通信以及工程上都是一个伟大的贡献。
  参考文献
  [1] C.E.Shannon:《A Mathematical Theory of Communication》,1948
  [2] 石峰,莫忠息:《信息论基础》 武汉大学出版社,2006
  [3] 邓集贤,杨维权,司徒荣等:《概率论与数理统计》 高等教育出版社,2009
其他文献
半固态金属加工技术是21世纪前沿性的金属加工技术,利用了金属从液态向固态转变或固态向液态转变时固液共存的特性,综合了凝固加工和塑料性加工的长处,与传统的铸造加工相比,显示出较大的潜在优势。本课题采用自行研制的锥桶式流变成形机(TBR),进行流变压铸工艺正交试验,研究了浇注温度、剪切速率及剪切温度对A356铝合金半固态流变压铸力学性能的影响规律,并确定了最佳工艺参数,使A356流变压铸件获得最优的力
期刊
現在是铝强化低碳汽车的时代,可以成批量生产和买得起的铝的强化低碳汽车。传统的汽车采用冲压板部件制成,对于有优异性能的钢板唯一认可替代材料用于这类汽车是铝合金板。铝和钢在成本和能源上竞争,铝板主要是通过闭环回收或通过后消费废料加工。主要挑战是通过回收后消费的废料来加工铝板,其性能匹配原来金属产品的性能。最大量采用回收加工废料和工艺废料也是重要的,这和寻找采用后消费废料相比是一个简单得多的问题。  汽
期刊
国际锡研究协会(简称ITRI)是全球唯一致力于支持锡行业发展和推广锡应用的组织,在锡行业有超过75年的经验。协会的主要目标是为锡行业的发展提供创新的、有竞争力的、可持续发展的供应链和市场环境。  国际锡研究协会的立足点是对影响锡行业重要的区域性或全球性问题做相关讨论并采取应对措施,促进全球范围内行业的发展,传达权威信息、领先技术和行业心声。  国际锡研究协会有如下几个原则性目标:与主要的锡生产商一
期刊
中铝山东企业(山东铝业公司、中国铝业山东分公司)自1954年建成投产以来,累计排出赤泥4000多万吨,现建有4个赤泥堆场。由于大量赤泥未得到大规模利用,占用了宝贵的土地资源,耗费了巨额堆场建设和维护费用,增加了生产成本,制约着企业可持续发展。公司所产赤泥以拜耳法赤泥为主,按含铁量高低基本分为两种:一种是低铝低硅矿产出的高铁赤泥;另一种是常规矿产出的低铁赤泥。多年来,公司始终高度重视赤泥的综合利用,
期刊
含重金属的废水最难生物降解,又有很大毒性,其毒害性在其形态改变或间接转移时不能得到根本性消除,处置不当,重金属离子还会返溶于水中,重新产生危害。目前,环保工作者已研发出了多种废水处理方法,其中,比较适合于含重金属离子废水的是浮选法,尤其近些年发展起来的电浮选法更有优势。电浮选法使用难溶性阳极,不会给环境带来二次污染,适应性和通用性很强,设备简单,管理方便,在处理低浓度重金属离子废水中更有效。  一
期刊
作为世界能源消耗大国,美国每年消耗约20亿枚电池,共花费104亿美元,同中国一样,也面临着废弃电池污染环境的巨大挑战。  在废旧电池的回收、贮存、处理和管理等方面,美国政府,尤其是各州政府的措施为我国提供了诸多可供参考的经验和范例。  回收率达97%  美国环保署、美国铝业协会、美国林业及纸业协会、橡胶制造协会和美国废物循环利用协会等组织发布的数据显示,2004年至2009年之间,美国铅酸电池回收
期刊
专利申请号:CN201010275683.3  公开号:CN101948960A  申请日:2010.09.08  公开日:2011.01.19-  申请人:广西大学  一种从含铁冶炼铅渣中回收铅的方法,是将含铁冶炼铅渣磨矿至200目占80%后,采用强磁选机在磁场强度4 000~6 000高斯条件下磁选得铅粗精矾将铅粗精矿用石灰作矿浆PH调整剂,硫化钠作活化剂,异戊基黄药作捕收剂,2#油作起泡剂进
期刊
近日,工业和信息化部节能与综合利用司副司长杨铁生接受记者采访,就《大宗工业固体废物综合利用“十二五”专项规划》(以下简称《规划》)的相关问题作权威解读。  杨铁生表示,到2015年,大宗工业固体废物综合利用量达到16亿吨,综合利用率达到50%。可以预见,“十二五”期间,大宗工业固体废物综合利用的总产值也将从10000多亿元提高到20000多亿元。到2015年,大宗工业固体废物综合利用的年产值将达5
期刊
一、尾矿综合利用基本情况  承德市位于河北省东北部,南邻京、津,北接辽、蒙,地域面积3.95万平方公里,人口372万,地质条件优越,山清水秀,是世界闻名的旅游城市;同时承德也是矿产资源种类繁多、储量丰富的矿产资源大市,共发现各类矿产上百种,累计探明储量近百亿吨,已开发利用矿产60余种,人均占有资源量2 307吨,潜在价值近万亿元。  近年来,承德市以超贫钒钛磁铁矿采选业为代表的矿业经济发展迅猛。“
期刊
一、概述  1.低品位废杂铜再生利用现状  我国是世界第一的铜消费大国,占到了世界总消费总量的三分之一以上,但我国铜资源储量仅占到全球总量的5.53%,铜精矿自给率只有25%,需要大量进口铜精矿。2010年进口铜精矿646.8万吨,同比增长5.54%。因而大力发展再生铜行业,充分利用国内外废杂铜资源,作为我国铜冶炼工业发展的重要组成部分。2010年我国精炼铜产量479.3万吨,其中再生铜产量约占2
期刊