基于结构和属性的图挖掘技术应用研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:fangming286
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图聚类作为从海量数据中发现有用知识的技术引起了人们的广泛关注。目前的聚类方法多是在基于图拓扑结构或基于图节点属性方面进行研究,而在某些实际应用中需要同时考虑图节点的拓扑结构和属性关系。因此,现有的图聚类方法在处理此类应用时存在对象建模不准确、聚类结果不理想、算法执行效率低等问题,为了解决现有图聚类算法在实际应用中存在的问题,本文在以下几个方面进行研究:首先,针对现有图聚类方法在数据集合建模方面存在的问题,提出了一种属性加权图的图模型。在模型中,顶点表示数据对象,边表示数据对象间的关系,顶点属性表示数据对象的特征。根据数据对象间的紧密程度和各特征值对数据对象的不同重要程度,分别对结构边和顶点的相应属性设定的不同的权值。通过建模,可使属性加权图更真实地表现现实应用中数据对象的实际分布情况。其次,针对现有结构与属性图聚类方法中存在的问题,本文提出了一种基于结构-属性的高效SACA(Structural andAttributed ClusteringApproach)图聚类方法。1)提出了属性加权图模型。该模型通过对图中的边和属性设定不同的权值,更好地反映实际应用中实体对象的复杂关系。2)提出一种结构-属性的统一度量方法,用以测量图相似度,图聚类算法可以通过该度量方法对结构与属性的相似度进行计算。3)采用随机游走模型对图结构和属性的相似度进行处理,将节点间结构与属性关系转换为相应的相似度矩阵,利用相似度矩阵进行进一步的处理,提高了算法效率。4)结合图结构与属性关系及相似度矩阵,采用信息传递算法对图进行聚类,使同一簇中的各顶点在拓扑结构上是紧密相连,且各顶点的属性是同质的;不同簇之间的顶点之间的连接是的稀疏的,各顶点的属性是异质的。最后,通过实验对所提出的SACA图聚类算法进行了验证。通过对比不同聚类方法的聚类结果,表明本文的SACA图聚类算法在聚类效果和时间复杂度等性能上要优于现有的图聚类算法。
其他文献
近年来,随着Internet的快速发展,Web为用户提供了大量的网页信息资源,并逐步成为了人们获取信息的主要途径之一。但Web数量及内容的快速增加,使得用户越来越难对网络中信息的
随着虚拟现实技术的快速发展和体感交互设备的不断推广,人们越来越倾向于使用自然、方便的方式实现人机交互,尤其是手势交互。因此,虚拟现实系统中手势识别的研究与发展具有
随着计算机技术的不断发展,为满足用户的不同需求,越来越多的软件在各行各业得到了广泛应用,尤其是仿真软件的发展应用;近年来,一些特定领域针对特定需求而开发的仿真软件在实际生
目前,大规模的人类群体活动不断的增多,规模也越来越大,如奥运会、足球世界杯、世博会等世界型的集会,举世瞩目,汇集世界各地大量的人群,大都市的商场、明星的演唱会等也会同一时刻
随着网络的快速发展,网络结构的不断扩大和复杂化,信息的安全问题也日益严峻。如何保障信息安全已经引起政治、经济及社会各界的广泛关注。由于目前防火墙和IDS体系的研究已经
在医学CT中,过大的扫描剂量对被扫描病人是有害的。低剂量扫描的一种有效方法是仅仅扫描稀疏视角下的投影。然而,基于稀疏数据的解析法重建会产生严重的条状伪影,影响诊断。2
软件危机的爆发表明落后的软件生产方式已经无法满足社会和企业对计算机软件新的需求,而构件化软件开发技术被视为解决软件危机的有效方法,如同搭“积木”式组装和开发目标软件
随着信息化社会的发展,网络的不断普及,中文信息处理技术的应用越来越广泛。中文分词技术作为中文信息处理技术的基础,已经成为制约中文信息处理技术发展的一项关键和核心技术。
网格计算作为支持全球化资源共享与协作的关键技术,具有广泛的应用前景。在网格环境中,资源的动态性、异构性、自治性等特点致使网格用户很难获得高质量的服务,网格系统通常
随着分布式应用系统在各领域担当越来越重要的角色,对分布式系统的安全也提出了更高的要求。在分布式系统容灾技术中,本文中对其中担负重要任务的故障检测技术进行了研究。在