网络特征学习算法在关联网络节点分类中的应用

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:jianzhang5555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我们的现实生活中,网络(network)或图(graph)数据无处不在,我们的社交网络、交通网络和生物网络中都存在不同规模大小的网络数据。近年来随着互联网行业的迅速发展,不管是金融银行业还是电商业,其存储的海量用户数据足以构建庞大的网络系统,而如何充分挖掘网络系统中节点的特征,帮助企业的用户进行全方位的客户画像和消费者行为分析也是近年来研究的热点和难点。本文在基于已有的网络特征学习算法和机器学习分类算法上,对传统的网络特征学习算法和近年来新兴的、比较前沿的网络特征学习算法进行了分类和总结,受到已有的相关算法和文献的启发,提出了总体的网络特征学习算法和机器学习算法结合用于多标签节点的主要分类学习任务框架,框架中的网络特征学习算法包括基于矩阵分解(拉普拉斯特征映射,LINE)的方法和基于随机游走(deepwalk,node2vec)的方法;框架中的机器学习算法包括逻辑回归和autoencoder深度学习框架。本文首次提出了将网络特征学习算法学习到的节点特征向量嵌入到autoencoder框架中,分别进行单任务学习以及多任务学习。所谓的单任务学习即有监督的多标签节点分类,多任务学习即同时进行无监督特征重构和有监督的多标签节点分类学习。在对模型的改进中将基于随机游走的算法学习出的节点特征向量拼接对应节点的邻接向量然后输入autoencoder进行多任务学习。为验证本文提出的算法的结合框架的思路和效果,选取三种不同类型的数据集,即社交网络数据集(Blogcatalog和Youtube),生物网络数据集(PPI),单词共现网络数据集(Wikipedia)。实验设置不同训练集和验证集比例(7:3和8:2),计算不同网络节点特征学习算法在不同机器学习分类算法上的分类指标(macro-F1 score)值,选取合适的超参数组合,证实了node2vec算法与autoencoder结合同时进行多任务学习对于节点分类主任务相较于文中提出的其他算法结合框架其分类效果有更高的准确性。同时在模型的改进环节中也证实了调参后的node2vec学习出来的网络节点特征向量与对应节点的邻接向量进行拼接作为autoencoder的输入进行多任务学习时,主任务的节点分类效果相比于文中提到的其他框架都更加准确。由此说明本文新提出的算法框架在基于实际业务的节点分类中具有一定的参考价值。
其他文献
随着高性能计算技术的逐步成熟和实验技术的快速发展,石墨烯及类石墨烯等新型二维纳米材料成为了凝聚态物理领域中的重点研究对象,其中,硅烯是过去五年中炙手可热的类石墨烯材料之一。硅烯是一种具有六角蜂窝状晶格结构的二维半导体材料,其与石墨烯具有类似的电子能带结构,即狄拉克锥;并且因其特殊的低翘起结构使该类材料具有较特殊的电子自旋性质,即在狄拉克点附近会出现约为1.55meV能隙,此能隙的出现意味着单层硅烯
本文设计了一种考虑执行机构力矩误差、快反镜光轴测量误差、星体控制误差、星体角速度误差和轴间耦合误差等多因素的快反镜指向误差分析方法,为提高快反镜的指向精度提供了
镁合金由于受到晶体结构的限制(密排六方结构),室温塑性差,变形极限低,成型困难。因此,提高其加工性,改善其变形性能是近年来镁合金研究的重要方向之一。热机械变形是镁合金细化晶粒的有效方法,因为镁合金滑移系少,层错能低,晶界扩散速度快,容易发生动态再结晶。本论文利用新型轧制方法——高速轧制(HSR)工艺生产出的镁合金组织均匀、晶粒细小,相比于铸态镁合金,具有更高的强度、更好的延展性和加工性;通过对轧制
生物碱是烟叶中的主要含氮杂环化合物,主要有烟碱、降烟碱、新烟碱等。其含量的高低不仅关系到烟的质量,而且直接影响人体健康。烟草中生物碱的分析方法有气相色谱法、高效液
会议
复杂网络中的大规模级联故障会导致灾难性后果,为了提高复杂网络的安全性和可靠性,越来越多人开始研究复杂网络级联故障。本文首先介绍了复杂网络和级联故障的研究现状,紧接着介绍复杂网络的基础理论知识,主要包括复杂网络统计特性及其演化模型,为研究复杂网络的级联动力学打下基础。为了更好地提高网络鲁棒性,采取必要的措施来缓解级联故障显得至关重要。不同于以往移除或新增节点(边)的方式,本文主要研究通过移除流量的方
针对连续流动法(YC/T 468-2013)测定烟中总植物碱存在仪器管路复杂、易析出晶体堵塞管路的问题,从仪器管路和试剂两个方面进行了优化改进,优化后的方法仪器管路简单,缓冲溶液
文本分类是一项重要的自然语言处理任务,目前的研究虽取得了不错的成绩,但依然存在不足。基于循环神经网络的文本分类方法只能获取局部文本信息。基于卷积神经网络的方法只有深层的结构才有上下文联系能力。池化操作对特征图进行压缩只能选择最重要的特征或均等的对待每个特征。针对上述问题,本文提出了门控和转置结构的注意力文本分类网络。转置结构具有全局的上下文联系能力,门控结构具有特征选择能力,利用注意力机制将特征图
随着智能监控视频技术的快速发展和油田作业区的信息化改革和建设,大部分的油田作业区监控系统仍然采用传统人工监控,可是传统的监控技术在油田作业区中存在不同程度地缺点和
到目前为止,标准模型在物理学上已经取得了巨大的成功,但是它并不能解释一切,宇宙中的暗物质、暗能量,正反物质的不平衡,中微子的质量来源等仍旧是未解之谜,因此,寻找标准模
我国航空事业在近年来得到了迅猛的发展,也对航空供电系统的性能也提出了更高的要求。航空三相整流器作为航空交流电网与机载直流电子设备间的接口设备,兼顾AC-DC变换和功率因数校正功能,其性能直接影响航空供电系统的发电效率、体积重量和电网电能质量。三相Vienna整流器具有高效率、高功率密度和高可靠性的特点,适合作为航空三相整流器的电路方案。然而,传统三相连续脉宽调制的开关损耗较高,不连续脉宽调制又存在