动态信息网中个体、社团及之间关系分析研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wei2006006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息网,表示了真实世界中众多的对象以及对象之间的联系,在多种现实应用中广泛存在。对信息网的分析研究具有重要的实际意义和广阔的应用前景。在实际中,信息网上的对象和联系常常随着时间的推移不断发生变化,这样的信息网称为动态信息网。近年来,动态信息网中个体、社团及之间关系的分析工作已经取得了一些研究进展,并被广泛应用于实际。但是,相关研究仍然面临着很多挑战。第一,动态信息网中尚有很多重要而有趣的个体、社团及之间关系从未被现有工作关注,及时注意到这些个体、社团及之间关系本身就是很困难的。第二,为研究动态信息网中个体、社团及之间关系,需要分析并建模个体和社团的动态行为特征,进而给出其合理的形式化定义,这同样是一个重要的挑战。第三,真实世界中的动态信息网常常规模庞大并且具有很高的数据演化速率,动态信息网中个体、社团及之间关系分析的很多问题都是复杂而难解的。因此,恰当地选取合适的数据结构来维护动态信息网上的数据,以及设计出适用于大规模、更新频繁的动态信息网的时空高效的算法有效地解决这些复杂问题,都是很具有挑战性的。本文聚焦于动态信息网个体、社团及之间关系分析中4个有代表性的关键问题,提出了一系列时空高效的算法有效地解决这些问题。具体地,先考虑重要而有趣的个体和社团的发现,分别研究了有吸引力的个体和社团搜索问题,以及稳定社团搜索问题;然后对于个体与社团之间关系进行深入分析,从而研究了多社团活跃对象探测问题和成员退组行为预测问题。本文的主要研究成果总结如下:(1)在动态信息网上存在这样一类重要而有趣的个体,他们随着时间的推移总是频繁地发展很多新的一跳邻居。针对该类个体及其组成的紧密联系的团体,本文首次提出了动态信息网上有吸引力的个体和有吸引力的社团的概念对其进行表示,并设计了一系列算法发现他们。本文分别形式化了有吸引力个体和top-k个最具代表性的有吸引力社团的搜索问题,并证明了后一个问题是NP-难的。然后,提出了时空高效的算法探测动态信息网上有吸引力的个体。接下来,分别设计了3种各具优势的算法搜索动态信息网上top-k个最具代表性的有吸引力社团。6个真实数据集上的实验验证了有吸引力的个体和社团在现实中的重要意义,以及本文提出的有吸引力的个体和社团的搜索算法的优越性能。(2)在动态信息网上发现那些随着时间的推移,内部成员总是频繁地保持着紧密联系的稳定社团是很有意义的,考虑到现有模型刻画动态信息网上稳定社团时存在明显的缺点,本文同时结合时间维度、稠密性和连通性,提出了(s,k)-truss稳定社团模型来刻画动态信息网上的稳定社团。本文形式化了动态信息网上多样性top-q个(s,k)-truss稳定社团的搜索问题,并且证明了该问题是NP-完全的。基于“过滤-验证”框架,本文设计了高效的(s,k)-truss稳定社团枚举算法。为搜索多样性top-q个(s,k)-truss稳定社团,分别提出了一种近似比为(1-e~1)的贪心算法,以及一种近似比为0.25的动态选择算法,并设计了有效的剪枝策略进一步节省时间开销。大量真实数据集上的实验说明了(s,k)-truss稳定社团模型相比于现有模型在刻画动态信息网上的稳定社团时的优势,还验证了本文所提算法的优越性能。(3)通过深入分析动态信息网中个体与社团之间的关系,本文首次提出了多社团活跃对象的概念来刻画动态信息网上这样一类特殊个体,他们在一段时间内频繁地游走于多个社团,进而设计了时空高效的算法发现多社团活跃对象。算法将每个对象的社团游走轨迹编码存储在位向量之中,然后将对象活跃性得分的计算转化成了位向量之间的按位与、或、异或等运算,从而大大节省了对象活跃性得分的计算时间。为进一步节省存储空间以及减少重复计算的时间,提出了基于滑动步长的优化策略。大量真实数据集和合成数据集上的实验,验证了多社团活跃对象在实际应用中的重要性,以及本文所提算法的时空高效性。(4)在动态信息网上,具有某些共同特征的对象常常形成群组。随着时间的推移,一些成员将会离开一些群组。无论对成员还是群组而言,预测哪些成员将离开哪些群组都是十分有意义的。考虑到现有的成员退组行为预测算法都是基于邻居信息的,在预测低度节点的退组行为时可能造成精度损失,本文结合成员自身的活跃度和群组的活跃度提出了新的成员退组行为预测算法来提高预测精度。具体地,本文分别给出了成员自身活跃度、群组活跃度以及“成员-群组”活跃性得分的形式化定义,并设计了一系列高效的技术计算这些度量。之后,提出了一个无监督的预测算法在动态信息网上持续地预测成员退组行为。大量真实数据集上的实验证明了本文提出的成员退组行为预测算法相比于目前最好的预测算法,确实很好地提升了预测精度。
其他文献
心肌片层是心室壁内心肌细胞的主要组织结构,同时也是实现心室功能的基本工作单元。心肌片层及其内部心肌细胞的三维空间排布规律与心脏的收缩舒张、心电传导、组织重构、生理病理等存在紧密联系,加强心肌片层结构研究可为心血管疾病的诊断、治疗提供理论依据和数据支持。但是,由于当前心肌组织的主要成像方式(如光学显微成像、电镜扫描成像、磁共振弥散张量成像、偏振光成像等)均无法提供超高分辨率心肌组织三维成像数据,心肌
学位
我国是一个煤炭生产和消费的大国。我国政府要求进一步提升煤电高效清洁发展水平,重点提出燃煤电厂应采用更加先进的燃烧技术。W火焰燃烧是燃煤电站机组锅炉的三种燃烧方式之一,它是专为燃用无烟煤、贫煤等难燃煤种而设计的。近年来,随着煤炭市场供应变化,W火焰锅炉开始掺烧或全烧烟煤。现有旋流W火焰锅炉掺烧或全烧烟煤后出现了燃烧器喷口烧损、水冷壁结渣以及脱硝入口烟温超温等问题,影响了锅炉安全、稳定运行。因此,为解
学位
中、高空长航时无人机滞空时间长,在对地观测等方面具有重要民用和军事价值,是各国争相发展的热点。低耗油率推进系统是研制超长航时无人机的关键。传统航空发动机热效率受到卡诺热效率限制,难以大幅度提高。通过有机结合高效率燃料电池与高功率密度燃气涡轮各自优势,本文提出了新型燃料电池航空混合推进系统,创新地采用燃料电池发电为压气机等部件供能,燃烧室尾气直接进入喷管做功。与燃气涡轮发动机相比较,混合推进系统不存
学位
激光光栅干涉测量技术是一种融合了激光干涉和光栅干涉原理的多自由度测量技术,既有光栅干涉测量的精度高、热惯性高的优势,又有空间光路短、对空气折射率不敏感的优点,能够有效避免空气环境下激光干涉测量精度受气流扰动的影响。因此,利用多个线位移激光光栅干涉测头实现的全干涉式位置姿态同步测量是超精密六自由度测量的一种优势方案,已应用于荷兰ASML公司研发生产的NXT系列深紫外浸没式光刻机中,是38 nm至7
学位
服务机器人和特种机器人需要在非结构化的山地、森林和城市家庭等环境中进行行走奔跑,代替或协作人类完成移动抓取、敲击加工等物理交互工作。这要求机器人必须具有优异的柔顺特性来保证人类、环境、物品和自身的安全,同时当具有较大的负载能力和准确的力控精度以便能够完成更多的工作和提供更有效的服务。磁流变液关节通过在传统机器人关节输出端串联一磁流变液离合器赋予了机器人关节优异的柔顺特性,同时具备了大负载和力控精度
学位
在传动系统中,扭矩是评价传动部件动力性能的一个关键性指标,通过对各旋转部件的扭矩进行测量,有助于对整个动力机械传动系统的传动效能进行科学评价。作为常用的扭矩测量工具,扭矩传感器广泛应用于电动机、发电机、内燃机等旋转动力设备输出扭矩及功率的检测,以及生产监控和质量控制等许多方面。为了保证扭矩测量的准确性和可靠性,需要定期对扭矩传感器进行校准。目前,绝对式扭矩校准多为实验室静态校准,主要采用悬臂梁加砝
学位
工业锅炉作为重要的供热供气设备,广泛应用于生产生活的多个领域。我国工业锅炉保有量约36.4万台,燃煤工业锅炉是其中的主导产品。由此可见,由燃煤工业锅炉生产运行而产生的环境污染问题不容忽视。中国已建成的工业煤粉锅炉在实际运行过程中大多存在以下问题:NOx原始排放量高、结渣严重、飞灰含碳量高等问题。因此,有必要开发出适用于工业煤粉锅炉的污染物排放量低、防结渣、稳燃性能好、燃烧效率高的燃烧技术。本文在电
学位
生物质资源因其储量丰富、可再生、碳中性、全球分布广泛和硫氮含量低等优点,被视为传统化石能源的理想替代品。作为传统农业大国,我国农林废弃物资源丰富,具有巨大应用潜力。生物质液化具有能量效率高、反应条件温和等优势,且无需对含湿原材料进行高能耗的预干燥过程,被认为是目前最具前途的可再生能源及高值化学品制备技术之一。然而,生物质液化油产物通常具有产率低、含氧量高、能量密度低、高黏度和腐蚀性等缺陷,难以直接
学位
高孔隙率开孔泡沫材料,具有独特的多尺度孔隙和空间网络结构特征,是一种新型的气体换热强化技术手段,已成功应用于电子设备散热等领域。由耐高温材料制造的高孔隙率开孔泡沫材料,在太阳能高温转换、高温气体余热回收、气体燃烧、飞行器热防护等技术领域也展现出广阔的应用前景。但由于对高孔隙泡沫材料内高温传热机理和特性的认识不清、缺乏可靠的热性能设计依据,导致高温泡沫材料的开发和应用受到极大限制。在涉及高温的工程技
学位
语音识别是人工智能领域的重要研究方向之一,它能将语音信号转化为对应的文本序列。目前关于语音识别的研究主要集中在基于深度学习的端到端技术上。深度学习模型通常需要等长的输入输出单元,但由于单个文本单元往往对应着连续多个语音帧,导致它们的序列长度不一致,因此,学习语音和文本序列间的对齐关系是端到端语音识别需要解决的关键问题之一。根据是否需要学习帧级的对齐关系,端到端语音识别技术可分为混合对齐型和软对齐型
学位