邮件通联网络链接预测关键技术研究

来源 :解放军信息工程大学 | 被引量 : 2次 | 上传用户:tongxu1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
链接挖掘作为数据挖掘的分支,它包含了对链接预测模型以及链接预测技术方法的研究。随着Internet的迅速普及和发展,电子邮件早已成为一种重要的通信方式,人们通过邮件通信记录能提取出适用于社会网络关系分析的数据,这使得邮件通联网络中的链接预测一直是数据挖掘领域的研究热点。本文根据邮件通联网络的特点,从多个角度获取有助于链接预测的信息,并针对多种已有链接预测方法的局限加以改进,提出三种分别适用于邮件通联网络演化链接和稳定链接的预测方法。通过在Enron邮件数据集上的实验表明,相对于已有的某些链接预测算法,改进后的方法具有较高的预测精度和预测准确性。本文的研究内容和成果具体可分为以下几个方面:1.已有的邻近度指标不适用于邮件通联网络的演化链接预测。本文根据邮件通联网络具有议题小组结构的特点,利用邮件议题信息对节点用户进行聚类分组,通过分析小组内和小组间演化链接的成因后,提出两种在已有算法基础上加以拓展改进的邻近度指标SIGCN和SIGRA来预测演化链接。实验表明,相比改进之前,改进后的算法的预测精度和预测准确度均有明显的提高。2.提出一种利用贝叶斯分类框架的新策略来预测邮件通联网络的演化链接。首先使用本文改进的邻近度指标SIGCN和SIGRA作为分类属性,优化其类条件概率,再通过对节点分类并根据类别间的通联概率分布提出新的分类属性IIs。为放宽使用朴素贝叶斯分类器的前提条件,利用改进的分类模型WCB组合所有分类属性来分类节点对,实现链接预测。相比优化前的分类模型,改进的分类预测方法大大缩短了分类训练时间和节省了内存使用空间,通过实验也展示了本文方法相比基于邻近度RA的预测法在预测精度上的较大优势。3.针对邮件通联网络中议题组结构特有的可重叠性和层次性,新定义了一种邮件通联网络的边演化模型框架HOSBM,并给出了HOSBM的似然估计函数表达式。通过借鉴已有的用来预测伪链接的思想,将其应用到预测稳定链接中去,并结合使用马尔科夫蒙特卡洛算法,提出了一种基于HOSBM生成链接可信度的邮件通联网络稳定链接的预测方法。最后的实验结果表明,相比已有的基于邻近度CN的链接预测法,新提出的预测方法在预测精度和准确度上有明显提升。
其他文献
通过对基层兽医从业人员面临的生物安全危害和常见的人兽共患病的探讨,以提高基层兽医从业人员技能水平及生物安全防护意识。加强生物安全防控基础设施建设和保障防护物资,严
速塑,作为小品雕塑其本身也是艺术作品。制作的手法很简要概括和绘画中的速写很相似,都是很自由、随意、约束性小且富有动感,并带有着浓郁的绘画味道,注重整体的气韵和精神性,甚至
综述了蓝萼香茶菜中发现的二萜化学结构及其药理活性,以及为提高蓝萼香茶菜二萜抗肿瘤活性进行的结构修饰和剂型改造研究,分析了当前蓝萼香茶菜二萜研究中的不足,展望了开发
在高职英语课程教学活动中,基于智能手机工具开展移动教学工作,有利于提升课程教学的整体效率。鼓励学生使用智能手机作为在线翻译的工具,有利于提升学生学习英语的效率和质
为提升高职动物生物化学课程的教学效果,本教学团队创新构建了基于雨课堂的课程教学新模式,将课前-课中-课后三个阶段进行了有机融合。通过这一新模式的实践与应用,取得了良
目的探讨中小剂量地塞米松对预防下肢急性创伤后软组织早期并发症的临床效果。方法采用简单抽样法,选取2015年1月至2016年3月间在我院治疗的符合标准的350例患者,随机分为对
企业家就要承担风险首先解释一下什么是“企业家”。企业家这个词,最初是法国经济学家坎帝隆使用的,就是从事产品销售和农产品、工业品批发的批发商。在英语当中,企业家是ent
海尔集团是我国最强的一家电器公司,然而在1984年以前,海尔集团还是一家濒临倒闭的集体工厂,亏损达147万元。而到如今它已发展成为拥有6,000多名职工,下设7个工厂、4个分公
SLD8S系列汽车SMT瞬态电压抑制(TVS)二极管提供7000W(10/1000μs)或2200W(负载突降)额定脉冲峰值功率耗损并采用表面安装式SMTO-263封装。这些高峰值脉冲功率耗损额定值可让电源系统
鱼类肠道菌群在促进建立机体免疫、屏障致病菌入侵、提高营养物质吸收与利用等方面起到重要的作用。本文通过归纳了鱼类肠道菌群的形成、数量及组成的最新研究进展,着重综述