关系马尔可夫网及其在社会网络中的应用研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:hotjune
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实社会网络中存在着许多关系数据,这些数据集合由不同类型的实体构成,实体之间广泛地存在着复杂的链接关系,对这些链接信息的挖掘可以为我们提供关于这个社会网络更丰富更准确的信息。因此,研究如何充分利用数据间的链接关系对数据进行分类在社会网络分析中具有重要的意义。   关系马尔可夫网是一种能够有效处理复杂关系数据的判别式概率图模型,由马尔可夫网和关系模式结合产生。将该模型应用于社会网络数据分类任务中,可以充分捕捉数据间的依赖关系,从而有效提高数据分类的准确度。   本课题对关系马尔可夫网模型的学习过程进行了一定的研究。其中,深入研究了采用似然估计方法构造模型目标函数的过程。研究发现,随着数据规模的扩大,该方法的时间复杂度越来越高。为了解决这一问题,引入了采用伪似然估计方法代替似然估计方法来构造目标函数。在参数优化方面,研究了共轭梯度法、梯度下降法和拟牛顿法等非线性最优化方法以及黄金分割法、牛顿法和Armijo-Goldstein法等一维搜索方法。并且从分类准确度和时间复杂度两个方面比较了各个算法的优缺点,力求给出一种较优的算法组合方案。   在实验过程中,针对Cora数据集和WebKB数据集分别采用关系马尔可夫网进行了数据分类。实验证明采用伪似然估计方法构造目标函数在时间复杂度方面比采用似然估计方法要低很多。在参数优化时,采用拟牛顿法和黄金分割法的组合方案可以同时取得较高的分类准确度和较低的时间复杂度。
其他文献
数据仓库和OLAP联机分析系统提供了一些方法和工具来分析企业信息系统中的数据事务。但是,只有其中20%的信息是可以被OLAP分析系统分析。对于其他的80%的数据,大部分都是文件
粒子群优化算法作为一种新的智能优化算法,由于其收敛速度快、参数设置少,近年来受到众多学者的研究和重视。它常被用于解决大量非线性、不光滑和多峰值的复杂问题优化,现己广泛
“地震成像”领域的巨大进展是推动石油勘探工业的快速发展的主要动力。地震成像系统实现地震勘探结果的成像,便于地震数据解释人员、地质工程师等对地下地质构造、分层信息
人体运动中包含大量的情感信息,是情感识别领域新的研究方向。但是目前基于人体运动进行情感识别的工作基础薄弱,大多是人工判别或者提取一些基本物理运动信息作为特征量进行机
近年来,随着网络的大量普及以及各种技术的快速发展,互联网上的信息呈爆炸性增长。人们要在网上快速查找自己想要的资料越来越困难,搜索引擎的出现为解决这一难题提供了方便。 
关联规则一直是数据挖掘领域中一个研究热点,被广泛的应用于各个领域。随着web2.0时代的到来,特别是以用户为主导产生互联网内容的社交网络的兴起,数据积累呈现出指数级的增
随着虚拟现实和计算机动画的发展以及游戏领域的需要,树木在风中摆动的模拟已成为研究热点。至今,在树的建模以及树木在微风中的运动方面,已有很多研究。但树木在强风作用下
随着生物学技术的迅猛发展,生物数据正在以几何数量级的速度增长。利用已知的生物网络和多源生物数据找到致病基因,对于了解疾病的发病机制、研发新型药物、制定精准医疗方案
光纤传感技术是伴随着光纤制造技术和光通讯技术的发展而逐步形成的。分布式光纤温度传感系统是专门为大范围多点温度测量的应用而设计的。它可以测量长达数公里的传感光纤沿
学位
嵌入式内存数据库(Embedded Main-Memory Database,EMMDB)是一种能够构建及应用于嵌入式系统或者设备之上的,采用内存数据库(Main-Memory Database,MMDB)结构组织形式的小型