【摘 要】
:
链路预测作为复杂网络中挖掘和预测缺失信息的方法,越来越受到人们的重视。尽管研究人员提出了各式各样的链路预测算法,但是对不同连边预测精度的差异性缺乏系统的研究。同时,在复杂网络节点未来度增量的研究中,目前基于偏好依附的流行度预测算法并不能很好的解决网络中新节点的流行度预测问题。本文旨在厘清复杂网络链路预测的精度分布特征,并通过聚合链路的预测结果实现对于节点未来度中心性的预测。本文的主要工作如下:(1
论文部分内容阅读
链路预测作为复杂网络中挖掘和预测缺失信息的方法,越来越受到人们的重视。尽管研究人员提出了各式各样的链路预测算法,但是对不同连边预测精度的差异性缺乏系统的研究。同时,在复杂网络节点未来度增量的研究中,目前基于偏好依附的流行度预测算法并不能很好的解决网络中新节点的流行度预测问题。本文旨在厘清复杂网络链路预测的精度分布特征,并通过聚合链路的预测结果实现对于节点未来度中心性的预测。本文的主要工作如下:(1)传统的链路预测值关注预测AUC的平均值,在本研究中,本文系统的分析了对测试集中每一条边的AUC,发现预测结果表现出显著的两级分化现象。通过进一步分析,本文发现对于那些网络中小度节点之间的连边的预测整体都很差,甚至低于随机预测的精度;而大度节点之间的连边的预测结果则非常高,接近于1。这个研究结果揭示了目前链路预测算法预测结果的异质性,同时为链路预测算法提供了改进的方向。(2)基于链路预测算法得到的连边未来出现的可能性,本文提出了一种基于链路预测的节点度增量预测算法,通过将连边出现可能性聚合从而实现对节点度增量的预测。本文系统的测试了14种链路预测的算法。实验表明,本文提出的方法能较为准确的预测节点度增量。研究中,本文发现度大的节点预测精度较高,度小的节点预测精度较低。该结果也揭示了在链路预测中,大度节点的预测精度比小度节点更可靠,验证了链路预测精度的异质性。(3)由于推荐系统本质上是二部图网络的链路预测,本文将网络节点中心性的预测方法推广到推荐系统中。目前对物品流行度预测的方法主要是偏好依附。偏好依附基于物品的历史流行度来预测未来流行度,而偏好依附通常对于大度节点有比较好的预测结果,但是对于小度节点,尤其是那些度相同的商品则完全没有失效。针对偏好依附的这些缺陷,本文基于协同过滤算法提出了一种基于推荐的流行度预测方法,通过结合每个用户的偏好和用户活跃度来预测物品未来流行度。实验表明,该方法在预测小度或度相同的物品未来流行度方面明显优于基于偏好依附的流行度预测方法。
其他文献
全球极端高温事件频繁发生,且呈现频次高、强度大、范围广的特点。极端高温天气在6、7、8月份出现次数也屡创新高,甚至部分区域每年都遭受高温灾害的侵袭。极端的高温天气给人类健康以及社会经济发展带来了严重的危害,高温天气越来越受到国内外研究学者的关注。本文选取长三角地区27个地市作为研究区域,利用研究区内42个国家基准气象站1951-2018年的监测数据,获得各个站点6、7、8月份的日高温数据,并将高温
京津冀地区是中国政治、文化中心以及中国北方经济的重要核心区,该区域下垫面复杂、发展变化迅速,年降水及气温变率较大,极易发生极端天气事件,通过数值模拟方法,详细研究下垫面特征变化对京津冀区域极端天气过程的影响,可为该区域天气的准确预报提供理论参考。本研究选择2016年7月19-21日京津冀地区的极端降水过程以及2020年2月8-9日河北冬奥赛区的夜间异常增温过程两个典型高影响天气个例,设置敏感性对比
基于1967-2017年美国环境预报中心和国家大气研究中心(NCEP/NCAR)的逐日再分析资料、英国气象局哈德来中心(Hadley Centre)的海温资料、国家气候中心整编的160站气温及降水站点资料及美国气候预报中心(CPC)提供的环流指数资料,通过计算冬季北半球风暴轴和东北冷涡结构的特征指数、谐波分析、经验正交函数分解(EOF)等方法,研究了不同时间尺度冬季北半球三大风暴轴整体和东北冷涡的
为了认识2017年5月7日发生在广东的一次暖云降水主导的极端暴雨过程中对流单体中的电荷结构特征及其形成原因,本文利用加入了起放电参数化方案的WRF数值模式,对此次暴雨过程进行了模拟研究,首先通过对比模拟结果与实际观测数据确定了模拟效果,分析了此次过程中一个单体成熟阶段电荷结构的特征及其成因,然后讨论了不同对流强度单体内底部正电荷区变化特征及其原因,最后探讨了强对流单体内感应起电机制对底部正电荷区的
城市化是人类导致环境变化的主要因素,城市内部下垫面水热特性和大气成分发生改变,引起区域气候变化,进而对植被的物候期造成影响。植被物候是气候变化和外界环境变化的感应器,研究城市植被物候,有利于深入理解气候变化和城市化对生态系统的影响。本研究以京津唐为研究区,利用2001-2019年MOD13Q1植被指数产品提取研究区内植被的物候参数(生长季开始期、生长季结束期和生长季长度),揭示其时空变化特征,并研
进入大气层的高速飞行器与空气摩擦导致气体电离形成等离子体覆盖于飞行器表面,形成“等离子鞘”。通信信号会被等离子鞘层削弱甚至完全阻断,即“黑障”现象,严重影响了飞行器再入大气层和着陆安全,因此等离子鞘层电磁波的传播是航天飞行器研究中必须解决的问题。本文采用理论仿真和实验方法,设计一个等离子体电磁波实验系统,研究等离子体中电磁波传输损耗特性,为解决等离子体对电磁波的屏蔽问题提供技术支撑。本文的主要研究
植被在地球系统中具有十分重要的作用,植被通过光合作用、蒸腾作用和呼吸作用等显著影响地面与大气系统的能量平衡,在气候、水文与生物循环等方面具有重要的作用,是人文和气候因素对地球环境影响的敏感性指标。最新研究表明,全球植被呈变绿趋势,即基于遥感的植被指数呈现正的年际变化趋势。量化变绿的归因常见方法包括基于模式的多情景对比分析,以及基于观测的统计分析推断。模式的优点具有归因明确和易量化各要素贡献,但是往
全球气候变暖、冰川融化、极端天气对植被生长环境带来的负面影响日益显著,导致植被覆盖度逐渐下降。江苏省是土地利用、植被覆盖度变化的热点地区,城市化、工业化的推进使得越来越多的耕地、林地向城镇、工矿、居民用地转换,城市热岛效应加剧。全省经济发展水平存在差距,南北产业结构不同,且目前的研究多以全省为研究对象,鲜有对未来植被覆盖度进行模拟预测。研究植被覆盖度的演变趋势、驱动因素及未来分布格局,对推进江苏省
流固耦合(Fluid-Structure Interaction)是流体力学与固体力学交叉而生成的一门力学分支,它是研究固体对流体场作用下的各种行为以及固体与流体相互作用的一门科学.流固耦合力学的重要特征是两相介质之间的相互作用.近些年,有关流固耦合问题引起了极大的关注.本文处理流体-热弹性板耦合相关问题解的适定性以及指数衰减,其中热作用是由一个“第二声”作用生成的双曲型的Cattaneo律;并进
混沌系统是一种特殊的非线性系统,是指确定性非线性系统中存在着貌似随机的不规则运动,对初值有着极端的敏感性。混沌系统在图像处理、信息安全、故障诊断、经济金融等众多领域中有着重要的应用,因此近几十年来,新混沌系统的建立、混沌控制与混沌同步等得到了广泛关注和研究。本文围绕混沌系统动力学分析与同步控制的相关问题进行研究,主要内容如下:首先,通过引入非线性指数函数项,提出一个具有无穷多个平衡点的新四维混沌系