图结构聚类中Why-Not问题的溯源解释方法研究

来源 :沈阳航空航天大学 | 被引量 : 0次 | 上传用户:wenwenan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图结构聚类对管理和分析图数据来说十分重要。SCAN聚类算法作为一个有效的图聚类算法,被广泛用于许多不同的图形应用程序中以发现有意义的集群,如社交网络、信息网络、协作网络、电子商务网络、通信网络、生物蛋白质网络等。但是,由于图数据中存在一些脏数据,如图数据中缺少一些边,这使得图数据经过SCAN聚类算法后的聚类结果不能满足用户的要求,例如期望的聚类中缺少期望的结点。针对这样的现象,用户就会提出为什么现有的图结构聚类方法没有返回他们想要的结果,以及如何做才能使得期望结点出现在聚类结果中,这类问题被称为why-not问题。解决why-not问题的根本目的,就是为聚类结果中的缺失结点找到合理的解释,这不仅能够帮助用户更好地理解聚类结果,还能够提高图数据库的质量和可用性。为了解决这一问题,首先,本文提出了一种有效的溯源解释模型。溯源解释模型通过数据修改的方式,来解释为什么期望结点没有出现在期望簇中,以及如何通过修改原始图数据集的方式,使期望结点能够出现在对应的期望簇中。在此研究思路下,本文首先分析了 SCAN算法的聚类原理,并在此基础上提出了统一的why-not问题解释框架。同时,为了在新的聚类结果中最大化地保留原来的聚类结果,本文提出了一种代价模型,定义了代价函数来量化溯源解释的代价。其次,本文提出了两种解释算法,why-not问题基础解释算法和why-not问题改进解释算法。本文的解释算法通过构建剪枝策略、定义代价函数的方法,以最小的代价来修改原始图数据集,使期望结点出现在期望簇中。最后,本文在真实数据集上进行了大量实验研究,实验结果表明本文的方法可以有效地解释聚类结果的期望结点。本文通过理论分析以及实验的验证,体现了算法的高效性和稳定性。
其他文献
随着人工智能、工业自动化和物联网技术的迅速发展,人们对位置服务的要求也越来越高,因此室内外高精度无缝定位成为了当下的研究热点。目前室内定位和室外定位均取得了些阶段性的成果,但二者分别处于一个独立发展的状态。基于以上本文提出了一种基于北斗和超宽带的高精度室内外无缝定位系统,以满足人们在任何环境下进行高精度定位的需求。本研究的主要内容如下:首先对目前现有的室内外定位技术进行大量的研究,并对不同定位技术
学位
过度收集和滥用个人网络行为信息会损害信息主体的权利和自由,阻碍数字经济发展。当下,对个人网络行为信息的法律定性悬而未决,导致相应的保护规则与秩序构建徘徊不前。传统信息主体赋权保护路径无法妥善解决信息关系中的权力结构失衡问题,应将个人网络行为信息纳入个人信息范畴,对其进行人格利益和财产利益的双重保护。新技术条件下,信息主体与信息控制者之间存在事实上的信息信义关系,个人信息保护路径应从赋权模式转向行为
期刊
非接触式眼科影像学检查主要是指在不接触眼睛的情况下使用仪器对眼部进行检查,目前在眼表疾病中应用十分广泛。临床上常用于眼表疾病的非接触式眼科影像学检查主要包括裂隙灯显微镜照相、非接触式眼表综合分析仪、眼前节光学相干断层扫描(AS-OCT)、眼前节光学相干断层扫描血管成像(AS-OCTA)、角膜地形图与非接触式角膜内皮镜等。非接触式眼科影像学检查具有对患者眼睛无刺激、操作便利、患者配合度高等优势,对眼
期刊
<正>随着爱美人士消费意识的觉醒、对皮肤护理认知度的提升,“面子工程”早已不局限于脸部,而是逐渐拓展至对全身的护理需求。时至今日,各种针对性护肤概念也层出不穷,但其实,了解身体各部位皮肤的差异性才能更好地有针对性地解决皮肤问题。
期刊
烟雾检测对现代户外火灾预警有着重大作用和意义,是现代消防系统的重要体现。目前越来越多的学者结合深度学习的方法进行烟雾检测,与传统烟雾检测算法相比,响应速度更快且检测范围更广。但在室外复杂背景下大多数算法难以同时获得较好的检测率和较低的误报率。本文在现有的基于深度学习的烟雾检测算法上,结合实际场景下产生的烟雾进行了深入的研究。本文的主要研究包括:(1)在选定实际场景进行实时监控的过程中,通过Vibe
学位
富国和强军,犹如车之两轮、鸟之双翼,任何时候都不可以偏废。尤其是党的十八大召开以来,国际军事竞争形式也越来越严峻,给我国的国防安全带来全新的挑战,对于经济社会的发展也有很大影响。习近平总书记明确提出将“军民融合”纳入国家发展战略中,随后也制定并出台了一系列相关的政策,指明了我国军事工业的重要发展方向。军民融合企业的发展是国家战略布局中较为关注的方面,也受到了社会各界的广泛关注。近年来,为了鼓励军民
学位
Heusler合金是一种非常优秀的金属间化合物,它不仅具有无穷无尽的成员,而且具有丰富的物理性质,如半金属铁磁体、超导体、热电元件、拓扑绝缘体、铁磁记忆合金等,几乎涵盖了整个凝聚态物理领域。其中具有半金属能带结构的Heusler合金由于有着自旋极化率100%的特点,在自旋电子学领域具有很重要的地位。根据Slater-Pauling法则,可以仅仅通过计算合金的价电子数就能初步预测它的磁性,能带性质,
学位
在飞机内饰设计中,内饰的舒适性越来越受到重视和关注。CMF是构成一个产品外观(或内饰)质量的重要因素,对使用者的体验起着决定性的影响。本文借鉴一般产品的CMF设计流程和设计方法,分别对色彩、材料和表面处理工艺三元素展开分析,总结色彩、材料和表面处理工艺在设计时需遵循的基本原则,探究其在设计应用时所遵循的流程和方法。研究色彩、材料和表面处理工艺的组合关系和相互影响,分析三个因素共同作用时,对使用者的
学位
城市发展中,文化街区的改造工作,对城市发展历程所凝练的文化价值的提升与创新起到重要的促进作用。城市文化是市民生存状况、精神面貌以及城市景观的总体形态,并与市民的社会心态、行为方式和价值观念密切相关。公共设施是街区的重要组成部分,科技的发展与外来文化的融入,使公共设施的造型设计在追求独特性的同时,往往忽视其内在的文化价值,导致城市街区文脉的缺失。因此,如何将街区的文脉与公共设施设计相结合,创造出具有
学位
企业实施内部控制能够激发企业承担社会责任的热情,对公司绩效的提升有着保障作用。企业主动承担社会责任能够让供应商、消费者主动对外宣传该企业,从而拉动公司的绩效水平。但大多数公司尚未将企业社会责任纳入完善内部控制制度的过程中,甚至还有高管认为承担社会责任只会增加公司的管理成本。因此,便很有必要去探究企业社会责任是否会在内部控制影响公司绩效的过程中发挥中介效应。本文同时使用理论分析法和实证研究法进行研究
学位