MLCPM-UC:一种基于模式实例分布均匀系数的多级co-location模式挖掘算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:h243173982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间co-location(并置)模式是一组空间特征的子集,其实例在空间中频繁地邻近出现.由于空间数据同时存在关联性和异质性,co-location模式实例的分布或在整个研究区域中全局出现(全局co-location模式),或在研究区域的局部区域出现(区域co-location模式),从而提出了多级co-location模式挖掘.当前的多级co-location模式挖掘方法存在两个问题:1)已有的多级co-location模式挖掘方法忽略了模式在空间中的分布特性,未能准确区分全局和区域co-location模式;2)已有的多级模式挖掘方法将全局非频繁co-location模式作为候选区域co-location模式,导致候选区域co-location模式数量过多.针对以上问题,首先,定义了模式的实例分布均匀系数,在考虑模式频繁性的同时考虑了模式在空间中的分布情况,从而正确、高效地识别出全局和区域co-location模式.其次,基于模式的实例分布均匀系数,设计了一个有效的多级co-location模式挖掘算法,提出了有效的剪枝策略以提高算法效率.最后,在真实和合成数据集上进行了广泛的实验,验证了所提方法的正确性和高效性.
其他文献
共识机制作为区块链技术的核心,决定了区块链系统的性能、可拓展性和安全性.针对当前区块链的性能、可拓展性问题以及维护系统安全所采用的激励机制成本高的问题,提出一种基于信任的双层可拓展共识协议(Trust-based Dual-layer Scalable Consensus Protocol,TDSCP).首先,通过结构化网络设计了双层协同的信任模型和共识算法,其中,信任模型根据节点信任值决定其能否获得生成区块的权利,避免了高昂的挖矿代价;其次,通过分区内双层共识算法提高共识效率,拓展了参与共识的节点数量,
区块链技术近年来发展迅速,很多组织和企业开始使用基于区块链和智能合约的去中心化应用(Decentralized Appli-cations,DApp)来增强其信息系统的功能、安全性以及扩展新业务.但由于区块链和智能合约本身可能存在安全与性能问题,因此DApp也会带来新的问题.为了深入研究和分析DApp的数据与行为现象,从而帮助用户更好地应用区块链和DApp,首先收集了 21类共2 565个DApp,并收集了这些DApp从2015年7月30日至2020年5月4日(约1 000万区块高度)的相关数据,共包括1
面对大量的物联网事务,高效的共识算法是区块链技术应用于物联网的关键。物联网设备大多以无线通信的方式接入互联网,基于此,文中构建了一种大规模无线密集型网络场景。针对该场景下实用拜占庭容错算法网络通信开销过高、共识时延较长、吞吐量较低的问题,提出了一种基于聚类的实用拜占庭容错算法。首先依据位置特征对节点进行聚类,形成一个多中心层次化的网络结构;其次将共识任务进行分解,在底层和上层网络中分别进行共识,以
混合云环境下,合理的数据布局策略对科学工作流的高效执行至关重要.传统的科学工作流数据布局策略主要基于确定性环境,而在实际网络环境中,由于不同数据中心之间的负载不同、带宽波动和网络拥塞等原因以及计算机自身的特性,数据传输时间存在不确定性.为了解决该问题,基于模糊理论,以最小化数据模糊传输时间为目标,提出了一种基于遗传算法算子的模糊自适应离散粒子群优化算法(Fuzzy Adaptive Discrete Particle Swarm Optimization Algorithm Based on Geneti
比特币是最成熟的公有链应用系统之一,用户密钥是比特币所有权确定过程的关键,比特币的安全由用户密钥的安全管理所保证,密钥的遗失会导致大量的用户资产流失,因此实现流失资产找回是亟待解决的问题.针对以上问题,提出了基于改进P2PKHCA(具有条件匿名的支付到公钥哈希)脚本方案的比特币密钥更新机制.首先,通过引入密钥生命周期和随机数改进P2PKHCA方案中的密钥生成算法,以解决其存在的密钥泄露问题;其次,提出两个新的操作符OP_KEYUPDATE和OP_TSELECTION来设计新的密钥更新脚本,以实现比特币系统
为了解决非平衡数据分类问题,提出了一种基于最优间隔的AdaBoostv算法.该算法采用改进的SVM作为基分类器,在SVM的优化模型中引入间隔均值项,并根据数据非平衡比对间隔均值项和损失函数项进行加权;采用带有方差减小的随机梯度方法(Stochastic Variance Reduced Gradient,SVRG)对优化模型进行求解,以加快收敛速度.所提基于最优间隔的AdaBoostv算法在样本权重更新公式中引入了一种新的自适应代价敏感函数,赋予少数类样本、误分类的少数类样本以及靠近决策边界的少数类样本更
时间序列信号被广泛应用于各种模式识别的场合,针对大量目标的时间序列信号模式识别率低的问题,借助多种图像化手段,将时间序列信号转换为图像,采用图像分类算法实现模式识别。实验中采集了前臂上30种手语对应的肌音信号(Mechanomyography, MMG),将其转换为不同风格的图像,设计卷积神经网络(Convolution Neural Network, CNN)框架,对图像化的肌音信号训练集建立模
针对个性化推荐,常用的推荐算法有内容推荐、物品协同过滤(Item CF)和用户协同过滤(User CF),但是这些算法以及它们的改进算法大多偏向于关注用户的显性反馈(标签、评分等)或评分数据,缺少对多维度用户行为和行为顺序的利用,导致推荐准确率不够高及冷启动等问题.为了提高推荐精度,文中提出了一种基于知识图谱的行为路径协同过滤推荐算法(BR-CF).首先根据用户行为数据,考虑行为顺序创建行为图谱(behavior graph)和行为路径(behavior route),然后采用向量化技术(Keras To
推荐系统缓解了互联网数据量剧增带来的信息过载问题,但传统的推荐系统由于数据稀疏和冷启动等问题导致推荐算法的准确性不高.因此,文中提出了一种基于知识图谱和标签感知的推荐算法(Knowledge Graph and Tag-Aware,KGTA).首先,利用项目和用户标签信息,通过知识图谱表示学习捕获低阶与高阶特征,将两个知识图谱中实体和关系的语义信息嵌入低维的向量空间中,从而获得项目和用户的统一表示.其次,分别利用深度神经网络和加入注意力机制的递归神经网络来提取项目和用户的潜在特征.最后,根据潜在特征预测评
在给定的任务中分析各种数据时,目前大多数研究只针对单源数据进行分析,缺乏应用于多源数据的方法.但如今数据日益丰富,因此提出一种多源数据融合框架,用于融合多种网络平台数据.同一平台数据中包含文本与各种属性,同时不同平台的数据在内容与形式方面也存在很大差异.然而现有的网络信息挖掘方法大多仅使用同一平台中的部分数据进行分析,忽略了不同平台的数据之间存在的相互作用.因此文中提出一种数据融合框架,一方面,能基于图的强大表示能力融合同一平台不同类型的特征,从而提升单个平台的任务性能;另一方面能够利用不同平台的数据特征