融合先验信息的属性网络表示学习研究与应用

来源 :河北地质大学 | 被引量 : 0次 | 上传用户:carinalove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网络数据研究成为数据挖掘领域热点问题之一。当前机器学习算法基于结构化的数据输入,很难直接应用到网络数据中。网络表示学习的出现为解决该难题提供了可行途径。网络表示学习通过将原始网络数据逐层抽象为自身任务所需的最终特征表示,挖掘出了网络中的深层语义信息,有效缓解了数据稀疏问题。网络表示学习在节点学习过程中融合属性信息有利于进一步挖掘网络中的语义信息,提高最终表示的质量。该类算法忽视了数据中易获得的先验信息,从而使得学到的表示缺乏区分性。本文围绕先验信息与属性网络表示学习的融合展开研究,主要内容如下:首先,针对现有ASNE算法中节点表示学习过程未利用先验信息而缺乏区分性的问题,提出一种将标签信息融入节点学习过程的改进方法。该方法利用少量的监督信息来指导节点表示的学习过程,恢复网络的潜在结构。在两个人工网络、四个真实网络进行实验,结果表明该方法在NMI与ACC上较原算法提高5%左右。其次,针对第一个实验中属性网络表示学习存在的问题,如节点降维维度的选择、属性信息与结构信息不能完美融合以及相比标签信息约束对信息更易获得的问题,提出一种预训练加优化训练的改进方法。该方法在预训练中通过新构建的有向图着重优化属性信息与结构信息的融合,同时利用更易获得的成对约束信息来优化学习过程,并利用数据增强的方式减少了计算量与时间开销,提高了准确率。其次该方法通过优化训练过程强化图邻居结构信息,以改善预训练中随机游走带来的影响。实验结果表明,该算法优于上面提出的融合标签信息算法。最后,为探究所提出算法的实际应用价值,使用Python以及Scrapy爬取知乎网的用户结构信息和用户个人信息来构建真实社交网络结构。并通过数据预处理等方法来去除噪声数据,使用本文中的算法来进行链接预测,以此达到后续用户潜在好友推荐的目的。
其他文献
中国石油大学(北京)信息学院探究建立参与广泛、内容丰富、机制健全的志愿服务党员教育管理模式,包括建立学生党员志愿服务信息库和服务质量认证机制、符合党员发展实际的志愿服
健康一直是人类关注的重点,如何通过饮食来保持健康更是永恒不变的热门话题。经济的迅速发展解决了困扰人类数千年的温饱难题,但是营养不良、营养过剩和其他与营养相关的诸多
<正>目的认知障碍是创伤性脑损伤(TBI)的主要后果之一,通过对TBI患者神经心理学检查和神经影像学检查,结合文献对结果进行分析,有助于认识这一疾病。
会议
<正>“体验性假说”是认知语言学的核心内容之。该假说认为“人的身体的、认知的及社会的体验是形成概念系统及语言系统的基础”(Rohrer 2003)。本文是一项关于体验性假说的
【正】高等数学的概念抽象、理论严谨,常给人以枯燥之感。要让学生乐于学高等数学,并且能够学得轻松,更多更快地掌握相应的知识,教师在教学过程中就要加强各类型动态思维能力
《九章》记载的屈原的"放逐",是一场生命的追寻,无论是历史的体悟,或空间、时间的感知。《九章》在放逐的过程中,展现一种生命能动,是屈学探索生命意义的表述,由此,我们要看到
目的观察中西医结合治疗前列腺增生合并下尿路感染的疗效。方法选取我院2013年1月~2014年6月收治的前列腺增生合并下尿路感染患者329例,将患者随机分为治疗组165例和对照组16
目的观察临床护理对门诊老年高血压病患者的效果。方法回顾性分析我院门诊2013年7月~2014年10月收治的55例老年高血压病患者的临床资料,在给予综合对症治疗的基础上,配合护理
【正】过去人们常把学习效果的好坏归结于自身智力的高低,但实践证明,学习效果在很大程度上取决于人的心理素质。心理素质包括智力因素和非智力因素,只有两者结合,人的学习活
【正】一、课程教学体系是培养学生实践能力和创新能力的关键1.掌握基本知识与掌握实践技能并重将学生实践和创新能力的培养引入整个培养过程,作为课程教学内容,通过将理论知