基于信息恒等式的属性数据分析

来源 :厦门大学 | 被引量 : 0次 | 上传用户:dickensking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性数据可描述很多问题,如人的性别,文化程度的高低。属性数据分析方法的应用几乎已经渗透到各个领域,包括社会科学,心理科学,生物医学,教育,市场营销,金融信用评估等。属性数据通常反映在列联表资料中,故研究列联表资料的分析方法至关重要。  国内外关于四格表的独立性假设问题的研究方法主要有Pearson卡方检验、Yates连续校正检验、Yule无条件检验、Fisher精确检验和似然比检验等;针对多个四格表的研究方法主要有BD检验、CMH检验和似然比检验等;在构造模型方面主要有分层对数线性模型和logistic模型等。关于四格表的无条件检验的精确功效分析已有研究,但它和条件检验的渐近功效分析没有进行过完整的研究;针对多个四格表的两步似然比检验也鲜有研究;同时,基于三维及以上列联表的线性信息模型更是少有涉及。本文主要从信息恒等式的视角对比研究四格表独立性假设的条件检验和无条件检验的功效分析,并将基于信息恒等式的两步似然比检验推广到备择假设,最后提出线性信息模型的扩展。  本文可能的创新点主要有以下几个方面:  第一,从信息恒等式的视角,重新对似然比检验、Fisher精确检验和Yates卡方检验进行统一的功效分析,即寻找合适的拒绝域以构建更敏感的检验;基于信息恒等式的不变性考察Yule无条件检验,表明用Yule检验批判Fisher精确检验的保守性存在逻辑上的缺陷。  第二,从信息恒等式的视角,解释两步似然比检验优于BD检验和CMH检验的原因,并基于扩展的信息恒等式,将两步似然比检验从“等优势比”发展到“不等优势比”。  第三,深入研究对数线性模型与线性信息模型的联系,得到两者的检验结果的等价关系,即利用对数线性模型的检验结果能直接得到线性信息模型的检验结果,反之亦然;从模型简洁度和解释各分解项的难易程度两方面进行模型对比,表明虽然线性信息模型在简洁度上优于对数线性模型,但解释线性信息模型中的高维条件互信息更困难。  第四,对四因子条件互信息进行分解,从而将信息恒等式推广到四维;并基于此信息恒等式提出四步似然比检验,比较总检验与四步检验的敏感度。用分解式代替线性信息模型中四因子条件互信息,得到线性信息模型的扩展形式。用线性信息模型的扩展形式解决高维互信息解释难的问题。
其他文献
2008年金融危机之后,各国政府推出了一系列的经济刺激政策。随后,国际商品价格持续上涨,我国物价水平也不断攀高。2010年,我国CPI上涨3.3%,2011年涨幅更是达到5.4%,广大居民普遍感觉
传统的燃料能源日渐枯竭,加之全球环境问题日益恶化,新型可再生能源备受关注。光伏能源具有无污染、无消耗、安全性强的特点,如何开发利用光伏能源成为全球能源战略竞争的重点。
棉花质量公证检验是我国 《棉花质量监督管理条例》 规定的法定检验制度,棉花仪器化公证检验数据得到涉棉各环节的接受和认可.检验结果的准确性关系交易各方利益,因此,对棉花
医院是非营利性的事业单位,人力资源是医院重要资源成本之一,在医院支出中的占比具有不确定性,所以对医院人力资源成本的科学化、合理化的控制变得尤为重要.本文阐述了人力资
《“遥·控”》多媒体与互动艺术当你走近一头巨大的钢制恐龙,恐龙便摇头摆尾地发出狰狞的吼声,你被吓退了,恐龙又安静下来。这个名为《霸王别姬》的艺术作品,其实是一个利用
期刊
颤纹缺陷是影响冷轧板表面质量的主要原因,从产生原因分析主要与轧机振动、轧辊磨削、轧制工艺的制定有关系。通过对轧制工艺、设备、轧辊磨削、操作方面的控制和调整,使颤纹
海洋产业的发展对人类具有重要意义。美国、日本、澳大利亚等国纷纷设定专门机构,实施海洋发展战略,旨在加快海洋技术开发,提升产业结构,实现陆地与海洋的和谐发展。相比于发
产业经济学是时下刚刚兴起的应用经济学科,它的研究对象是“企业整体”即是产业,主要研究产业结构、产业分布,产业联系和相关的政策等等.在经济学理论中,产业经济理论是一个
在经济全球化条件下,一国投资环境的优劣决定了该国对生产要素的吸引能力。税收是投资环境的主要因素之一,提高一国税收竞争力对于营造良好的投资环境起着重要作用。世界银行和