网络数据的判别分析和因子模型

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:lshel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,人类社会逐渐步入复杂网络时代.随之而来,我们生产生活中涌现出大量的网络型数据.对于这种新型数据的分析,是摆在如今科研工作者面前的一大难题.在统计学中,关于网络型数据的分析一直是围绕着两大问题展开的,即探究网络中信息的传播方式以及揭示网络结构的生成机制.本文的工作同样围绕这两个问题展开.首先,关于第一个问题,我们建立了一个利用网络结构进行分类的统计模型,称为网络线性判别分析(NLDA).NLDA模型同时考虑到了协变量信息和网络信息,对于一个类未知的节点能够利用两部分信息进行分类.理论上,我们研究了该分类模型的理论误分类率并且在相当温和的条件下给出了理论误分类率的上界.此外,对于常见的稀疏网络结构,我们在不同的稀疏性假设条件下,研究了NLDA模型的相应的渐近行为.为了研究新提出的分类方法在有限样本上的表现,我们设计了一系列的模拟实验,并用一个收集自新浪微博的真实数据集来展示该模型的效果.其次,关于第二个问题的研究,我们基于高维因子分析模型,构建了一个关于连续型网络数据的生成模型.该模型假定网络的生成受到潜在的因子结构所影响,其中主要包括潜在的节点发出者和接收者效应以及节点间更高阶的依赖关系.理论上,在一定的假设下我们得到了模型中参数的可识别性.并进一步证明了参数极大似然估计的相合性和渐近正态性.此外,我们也设计了一系列模拟实验评估该模型在有限样本上的表现.
其他文献
几十年来,中国大力发展经济,在国际上逐渐展现大国形象,然而遗憾的是,腐败问题一直未能得到有效解决。面对严峻的腐败形势,党和国家也引起高度重视,不断加大反腐力度,打击腐
生存时间常表现为起始事件和终止事件之间的持续时间。由于任何研究都不能无休止地进行到所有个体的终止事件发生,并且在追踪观测过程中还会有其他不可控的因素影响终止事件
<正>为了打造风险管理体系,珠江西江产业投资基金首先重点培育风险文化。和很多私募股权投资基金不太一样,珠江西江产业投资基金作为国家发展改革委批复同意设立的第22支国家
<正>普陀山佛协根据普陀山佛教的实际情况,坚持创新管理,推动规范化和制度化管理,深化依法管理,努力探索具有普陀山特点的管理新路子。一近年来,在国家宗教局、浙江省民宗委
生物法脱硫是利用与硫有代谢能力的菌体,定向诱发硫化橡胶的硫交联键断裂,达到再生废橡胶的目的。这是近年来发展的一种新的无污染的废胶回收方法。符合国家保护环境和持续发展
在2015年10月,中国共产党第十八届中央委员会第五次全体会议提出了“创新、协调、绿色、开放、共享”的五大发展理念。在绿色、共享理念的推广及移动互联网信息技术的飞速发展之际,共享单车应运而生。共享单车逐步呈现出了产业链的发展态势且在短期内得到了迅猛发展。本文探究了共享单车产业链在山地型城市中发展的可行性。从山地型城市特色出发,侧重于解决共享单车产业链在山地型城市中出现的独特问题,采取符合山地特色的
自然景区拥有丰富的自然资源,对于提升居住环境品质进而提高周边住宅的价值具有显著的效果。同时自然景区也是稀缺的旅游资源,可以通过对景区周边的开发建设为社会创造更多的
主要研究高中数学课堂自主合作探究教学实践,分析了自主合作探究教学的理论基础和在高中数学教学中的作用,并从小组合作教学与教学情景创设两方面,对高中数学课堂自主合作探
目的探讨凝血、抗凝及纤溶指标检测在冠心病、脑梗死中的表达及意义。方法 80例冠心病患者(冠心病组)和110例脑梗死患者(脑梗死组)以及80例接受体检的健康者(健康对照组)为研
2018年全球经济增速趋缓,中美贸易战持续,中国市场的跨国物流企业的大客户营销面临着外部政策、同行业激烈竞争和大客户消费变化的严峻考验。在这样的研究背景下,F公司自身传统的粗放型大客户营销策略已不适应复杂多变的环境。本论文的研究目的旨在完善F公司的大客户营销策略,提升企业竞争力。在研究方法上采用了文献研究法、访谈调查法和案例研究法。本论文总体研究思路可概括成三个部分:首先,依据F公司的大客户营销所