基于过滤和核心子图提取的社交网络数据高效管理方法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tianyou424
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络技术的快速发展带来了大量的社交网络数据,社交网络数据的存储和查询也迎来了巨大的挑战。目前,已有的存储策略并不能很好的适应社交网络数据。一方面是因为社交网络数据的无效数据较多,需要进行过滤以剔除无效数据来节省存储空间和提高数据分析效果。另外一方面是目前的存储策略没有考虑到当前数据对于过往数据的影响,数据之间的联系分析不够。基于以上两点,提出了基于过滤和核心子图提取的社交网络数据高效管理方法。首先,利用伪随机概率模型和对高频关键词敏感的朴素贝叶斯模型进行联合判断,用以过滤出社交网络数据中的无效数据。其次,将过滤后的数据转化为图数据进行分析,在每次数据更新时,计算节点热度、节点度数,同时进行节点热度的辐射以体现出当前数据对过往数据的影响。联合上述三个度量指标对图数据进行核心子图提取。最后,根据提取出的核心子图判断数据的冷热情况,根据数据的冷热进行分离存储。实验结果显示,设计的混合过滤模型、核心子图提取和冷热分离存储策略均具有最优的效果。混合过滤模型花费的时间没有过多高于两个单独的模型所花费的时间,过滤精确率比两个单独的模型提升了6.4个百分点。核心子图提取效果至少是其他方法的1.1倍。经过冷热分离存储后,查询时间比不经过任何处理缩短了36%,比其他方法缩短了至少11%。证明了该方法在过滤、核心子图提取和冷热分离存储策略上的有效性。
其他文献
2020年《民法典》的颁布是我国法律界的一件大事,其中对《婚姻法》的离婚经济补偿制度进行了重大修改,在一定程度上体现出对家务劳动价值的重视,但还不能满足现实的需要,应该完善现有婚姻家庭法律制度,修改《民法典》有关条款,目的在于体现对家务劳动价值的尊重,并将其具体量化。
期刊
菝葜(Smilax china L.)是百合科菝葜属多年生藤本落叶攀附植物,目前主要分布在缅甸、越南、菲律宾、泰国及中国等地的海拔2000米以下的山坡及河谷。菝葜主要的药用部位为其根茎,临床上主要用于治疗妇科炎症、关节疼痛、肌肉麻木等。目前研究已经证实菝葜具有免疫抑制、降脂、抗氧化、抗炎及抗肿瘤等活性,其中针对菝葜素、黄酮、酚类及萜类物质的研究较多,而菝葜多糖(Smilax china L.pol
学位
随着我国卫星遥感技术的不断发展,庞大数据量的遥感图像下传成为一个需要解决的难题。传统解决方案是采用图像压缩技术对图像进行处理,然而在卫星对地的数据传输带宽未得到显著提升,可在轨应用的无损图像压缩算法从编码原理上没有突破的情况下,满足大数据吞吐率和红外小目标的可能有损丢失成为一种矛盾。为了解决这一矛盾,在本文中提出了一种“FPGA+ASIC”架构下的保弱小目标信息智能压缩方法,在ASIC中集成在轨图
学位
长江经济带是我国重大国家战略发展区域,也是人口最多、城市体系最完整的巨型流域经济带。在“共抓大保护、不搞大开发”的限定背景下,寻求经济发展与环境保护的协同共进是时代交给长江经济带的新命题。本文以城市土地利用生态效率为切入点,基于影响机理,实证检验制造业集聚对城市土地利用生态效率的影响,助力长江经济带生态环境示范区和新型工业化示范基地建设。主要研究结论包括:(1)长江经济带制造业集聚水平远高于全国平
学位
在人口众多、经济迅速增长和城镇化进程不断加快的背景下,实现土地利用可持续发展,需要深刻认识土地利用发展机理、掌握土地利用影响规律。随着土地利用的不断发生,土地利用不确定性也在逐渐加深,我国土地利用研究逐渐从横向开拓向纵向挖掘的方向发展。在新型城镇化的背景下,基于城市土地利用结构和空间安排的现状和不足,从土地供给侧结构改革出发,运用贝叶斯网络和模糊数学规划的方法,对土地利用影响机制和土地利用结构优化
学位
[研究目的]国际舆论研究既需要覆盖范围广泛,也需要针对细分群体进行分众化分析,而已有的以文本为中心的舆情分析方法难以满足上述需求。因此本文提出一种以网络为中心的国际分众舆情分析方法。[研究方法]首先采用个性化网页排名算法对社交媒体用户随机游走采样,得到未被社交机器人污染的大规模用户网络,然后基于社交媒体舆论嵌入在各种同质网络中这一特征,用经典稀疏主成分分析对用户网络进行社群聚类,将具有共同纽带或身
期刊
【目的】在课题组前期研究构建的贫困脆弱性健康风险因素识别指标的基础上,基于预期贫困脆弱性理论测算农村老年慢病家庭的贫困脆弱性指数,并结合其实际收入对贫困脆弱性分型;分别对全样本及各种类型的贫困脆弱性进行健康风险因素分解,以考察主要健康风险因素对贫困脆弱性的贡献程度和影响大小;并进一步探索各健康风险因素对贫困脆弱性的作用路径,从而分别就不同的贫困脆弱性类型提出针对性的健康扶贫治理策略,巩固脱贫攻坚成
学位
旋转机械故障诊断研究对降低维护成本、提高工业生产的安全性具有重要的现实意义。由于深度学习具备从海量数据中自动提取故障特征的能力,因此能在一定程度上克服人工提取特征的缺陷,然而传统基于深度学习的故障诊断方法仍存在一定的局限性:1)原始振动信号中存在的背景噪声会干扰模型的特征学习性能;2)数据不平衡问题会降低对少样本类别诊断的可靠性;3)变工况问题会导致不同类别的样本在特征空间上存在混叠,影响诊断模型
学位
生物质是唯一可以转化为液体燃料的可再生能源,具有储量大、分布广且利用过程中二氧化碳“近零”排放等优点。近年来,生物质催化快速热解(CFP)制备高品位生物油技术得到越来越多的关注,其中使用ZSM-5催化剂可以使生物油中富集苯、甲苯和二甲苯(BTX)等单环芳烃产物。BTX是重要的燃料添加剂和大宗化工原料,目前主要来源于石脑油等传统化石原料的催化裂化,具有不可持续性。因此,生物质催化热解制备芳烃不仅为生
学位
烤烟种植是道真县的重要农业产业之一,有效防治烤烟黑胫病是保障当地烤烟产业可持续发展的重要环节。为道真县烤烟黑胫病的防治提供技术支撑,2021年于道真县设计4个施肥处理(西姆+花椒籽+生物炭有机肥80 kg/667m2;Tpb55+花椒籽+生物炭有机肥80 kg/667m2;施用当地常规有机肥80kg/667m2;不施用有机肥)的云烟97种植试验,比较不同施肥处理的烤烟农艺性状、产量及黑胫病发病情况
期刊