矩阵正态因子模型和矩阵数据逻辑回归模型

来源 :东北师范大学 | 被引量 : 1次 | 上传用户:lixiang1336
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学的持续进步和技术的日新月异,矩阵型数据越来越普遍.在本文中我们主要关注其中两种类型的矩阵数据.第一种类型是连续型的矩阵数据,即矩阵的元素是实数.连续型矩阵数据的表示能力强大.首先它能够表示权重网络数据,比如路由器之间的数据交换量,网页之间超链接的强度等等.其次,传统的多元统计分析中的设计矩阵通常也可以看作是行独立的矩阵数据.最后,我们常见的图像,视频,生物信息等数据也可以看作矩阵数据.第二种类型是二值离散型的矩阵数据,矩阵的每个元素非0即1,这种类型的矩阵数据通常用来表示网络数据.网络指的是通过各种各样关系相互连接的个体集合,其中个体称为节点,两个节点之间的连接称为边.比如在计算机领域中,互联网上各个路由器可以看作节点,它们之间的数据交换可以看作边.万维网中各个网页可以看作节点,网页之间的超链接可以看作边.在实际当中的电力网络,交通网络,社交网络,生物信息网络以及金融贸易网络等都是典型的网络数据.网络数据的矩阵表示称为邻接矩阵,邻接矩阵中的元素表示两个节点之间的连接关系,如果两个节点之间有边,那么该元素取值为1,反之,则为0.总之,矩阵型数据强大的表示能力使得其适用范围非常广泛,是一类值得深入研究的数据类型.本文的第二章考虑的是高维连续型矩阵数据在只有一个观测时的统计推断问题.我们在矩阵变量正态分布的可分协方差结构中引入因子效应,提出了矩阵正态因子模型(MVNFA).对MVNFA模型,我们首先证明了模型的可识别性,给出了估计方程的推导和化简,以及参数估计的迭代算法.接下来,我们证明了参数估计的相合性和渐近正态性.最后通过模拟研究验证了理论结果,并通过实际数据的分析说明了模型的应用价值.本文的第三章考虑的是二值离散型矩阵数据(网络数据)中节点的分类问题.数据包括个体的类标签,预测变量以及个体之间的网络结构三部分信息.研究目的是将网络结构引入传统的分类问题(即将类标签作为响应变量).为此,我们提出网络逻辑回归模型(NLR),该模型考虑了从网络当中获得的信息.NLR模型假设两个节点是否相连受类标签和二者预测变量间相似性的影响.此外,采用传统的LR模型利用节点属性预测类标签.接下来,在NLR模型下,我们讨论了四种关于网络结构的连接构成的有趣情况.此外,在不同的网络稀疏性下,我们导出了预测准则的近似性质.最后,为了说明该模型的有限样本性质,我们进行了模拟研究,同时对一个真实的新浪微博数据进行了分析.
其他文献
在谈及如何看待《政府工作报告》中专门提到煤矿事故时,全国人大代表、四川大学校长、中国工程院院士、中共中央候补委员,国家973项目首席科学家谢和平认为,安全是一个人最基
煤热解油是煤炭综合高效利用过程中的重要产物之一,其环境友好地为人类所利用意义重大。煤热解油成分复杂,其中含有的酚和吲哚是高附加值化学品。从煤热解油中分离出这些化学
海洋初级生产力在海洋环境要素的驱动下,在不同海域呈现出不同的时空变化特征,这种时空演变特征在不同的ENSO事件类型下差异更为显著。本文基于1998年1月至2017年12月全球海
众所周知,翻译实际上是一项非常复杂的活动,是架起不同文化交流的桥梁。翻译从某种意义上被认为是一种阐释,而阐释学主要涉及意义与理解之间关系、读者与文本之间关系等内容,
两宋山水画风格发生了嬗变,本文希望通过对两宋私家园林园记文献的解析,对园记中的私园造园风格进行系统研究,解答与绘画关系密切的私家园林造园风格是否也发生了转变。为此
随着计算机技术、信息安全技术和机器学习技术的快速发展,基于生物特征的身份识别技术也得到了迅猛发展。目前,基于指纹识别的身份认证广泛的应用于门禁系统、电子产品解锁以
本文主要分析了事业单位薪酬福利管理存在的问题,重点介绍了薪酬福利管理的一些常见现象,并且提出了几点事业单位薪酬管理的建议,希望能够有效促进事业单位薪酬管理工作的有
在扶贫攻坚的关键时期,作为广东省省级党报的《南方日报》,在助力全省信息扶贫方面,仍旧有着其他媒体无可替代的权威主体优势。本文基于新闻叙事学理论,将2012-2017年间《南
本文通过对电容式微机械加速度传感器的原理进行分析,针对影响传感器性能的非欧姆接触因素进行分析,从而进行关于微机械加速度传感器的温度补偿电路设计,通过稳定性测试手段
  丹参是我国传统医药学中应用最早而且最广泛的药物之一,也是应用现代化学、医学、生物学、药理学技术研究比较深入的中药之一.经过长期的研究,对丹参的生物学特点、化学