【摘 要】
:
给定一个图G,边分类指利用G中有标签的边来给无标签的边加标签的问题。边分类问题在图挖掘和社会网络分析中有着广泛的应用,如关系发现、关系分类和关系推荐等。本文针对在大
论文部分内容阅读
给定一个图G,边分类指利用G中有标签的边来给无标签的边加标签的问题。边分类问题在图挖掘和社会网络分析中有着广泛的应用,如关系发现、关系分类和关系推荐等。本文针对在大图中基于邻居相似性的边分类问题进行研究,研究内容如下:首先,通过深入分析现有方法,发现现有边分类算法在确定边(u,v)的标签时,通过计算u与邻居集合S(u)中顶点的相似性和v与邻居集合S(v)中顶点的相似性来推断边(u,v)的标签。这种方式需要判断相似顶点对的次数是|S(u)|*|S(v)|,实际应用中存在效果差,效率低的问题。其次,提出一种在线动态局部索引,可以降低图遍历的次数,从而提升求解效率。针对已有方法需要多次遍历图才能得到结果的问题,在第一次遍历图的过程中,记录已经求得的边的标签信息,在后续判断相似度最高的边时,无需对数据图再次遍历,直接通过索引求解。同时减少计算相似性顶点的数量,降低求解时遍历图的次数,提升求解效率。再次,针对上述方法存在效果差的问题,提出利用u的邻居和v计算相似性得到相似度最高的顶点w1,同时利用v的邻居和u计算相似性得到相似度最高的顶点w2。假设w1与v的相似性高于w2与u的相似性,则用w1与u之间边的标签来表示边(u,v)的标签。这种求解边分类问题的思路可以避免已有方法无法给部分边贴标签的问题,同时提出基于以上思路的高效算法BNSCA来求解边标签,同样将原方法判断顶点对相似性的次数从|S(u)|*|S(v)|减低到|S(u)|+|S(v)|。最后,在实验阶段,基于3个真实数据集。从计算相似顶点的时间,对无标签边贴上标签的准确率等方面进行了比较,验证了本文所提方法的高效性与准确性。
其他文献
镍纳米纤维作为性质稳定的一维磁性纳米材料已经引起人们的广泛关注。目前,它已经在电化学、生物医学装置、催化等领域表现出优异的性能。然而,常用的热还原法制备镍纳米纤维将不可避免地使用到压缩氢气,这不仅会造成大量的氢能源消耗,而且存在着潜在的安全问题。因此,寻找一种无压缩氢气使用的安全还原方法来制备镍纳米纤维是至关重要的。氢能源被认为是一种洁净、高能量密度的新兴能源。然而氢气的安全存储和释放限制了氢能的
化石能源的过度开发导致气候的突变,迫使人们寻找可持续的、环境友好的燃料与化学品。木质纤维素被认为是地球上最丰富的资源,能作为可再生的具有高附加值的化学品与生物燃料
素质教育要求加强中小学生的心理健康教育,而诸多研究表明情绪智力与心理健康水平呈正相关关系,如何提升中小学生的情绪认知和管理水平就显得尤为重要。六年级小学生又处于小学和中学的过渡阶段,情绪发展有不稳定性、自主性、任性自私等特点,如何有针对性地提高该年龄阶段的情绪智力是亟待研究的课题。本研究旨在探究六年级小学生情绪智力现状以及情绪智力团体心理咨询对六年级小学生情绪智力的干预作用。本研究采用《国小学童情
中国作为世界上最大的发展中国家,在经济大幅发展的同时,中国的能源效率低下的问题引起学者关注。影响中国能源效率的因素有很多,本文试图聚焦在国际贸易这一因素上,探究国际
随着经济全球化和生产社会化的不断推进,企业在各种生产要素获取上竞争激烈,其中资金是企业生存的血液,首当其冲。近年来如何使债务资本成本最低成为企业不得不面临的重要问
热电系统由于其低效率而未被广泛使用,其效率受到热侧相关热设计的影响。本文主要关注点是通过使用蒸气腔散热器,提高热电系统性能,通过提供低的总传热热阻,有效的热扩散能力
无线传感器网络(Wireless Sensor Network,WSN)是一种由多传感器节点构成的用于监测目标区域的自组织网络。目前研究中,较小的覆盖空洞可通过一定的机制进行自我修复,但对于
Y公司2000年成立,是广州市重点软件企业/广东省软件和集成电路设计产业百强培育企业,业务范围包括软件开发、规划咨询、工程实施、技术服务、系统集成、代维服务。Y公司大部
橡胶果是热带作物橡胶树的种子,脱壳是橡胶果加工过程中很重要的环节。目前橡胶果脱壳机械很少,而且还存在脱壳率低,整仁率低的问题,严重影响了橡胶果的综合利用价值。针对目
随着软件应用领域不断扩大,软件系统规模日益复杂,耗费科技人员大量的时间和精力。如果能从海量的软件动态执行轨迹中挖掘出具有代表性的信息,为分析软件系统的结构特征以及