CPM-MCHM:一种基于极大团和哈希表的空间并置模式挖掘算法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:jianlzho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间并置(co-location)模式挖掘是指在大量的空间数据中发现一组空间特征的子集,这些特征的实例在地理空间中频繁并置出现.传统的空间并置模式挖掘算法通常采用逐阶递增的挖掘框架,从低阶模式开始生成候选模式并计算其参与度(空间并置模式的频繁性度量指标).虽然这种挖掘框架可以得到正确和完整的结果,但是带来的时间和空间开销非常大.此外传统方法对于空间并置模式的最小频繁性阈值较为敏感,当最小频繁性阈值改变时整个挖掘过程需要重新进行.因此,本文提出一种基于极大团和哈希表的空间并置模式挖掘算法CPM-MCHM(Co-location Pattern Mining based on Maximal Clique and Hash Map)来发现完整并且正确的频繁空间并置模式.CPM-MCHM算法不仅避免逐阶候选-测试框架带来的巨大开销问题,还降低了算法对最小频繁性阈值的敏感.首先,采用基于位运算的分区Bron–Kerbosch算法生成给定空间数据集的所有极大团,并将其存储在哈希表中.然后,提出一种两阶段挖掘框架计算所有模式的参与度并过滤所有频繁空间并置模式.最后,在真实和合成数据集上进行了大量的对比实验.与经典的传统算法和近两年内学者提出的两种算法相比,当实验数据的规模达到20万实例数时,本文提出的CPM-MCHM算法的挖掘时间和空间耗费分别降低了90%和70%以上,当实验数据量进一步加大时CPM-MCHM算法的优势更加明显.
其他文献
行星减速机背隙大小是影响减速机传动精度和运动平稳性的重要指标,也是划分减速机传动精度等级的主要参数,针对目前背隙检测设备普遍存在的扭矩加载不精确、兼容性不强、测量效率不高等问题,研制了一种减速机背隙自动检测装置.首先,设计了一种结构简洁、适用于多种机型检测的机械结构,提高了装置的兼容性;然后,结合精密伺服系统和高精度扭矩传感器,构建了扭矩加载闭环反馈系统,实现了扭矩精确动态加载;开发了PLC控制系统,实现了检测工作过程的自动化,提升了检测工作效率;最后,设计了对比测量实验,并对装置进行了测量系统分析.研究
为查明贵州省遵义市某养殖场110日龄鸡发病死亡的原因,采集病死鸡的肝脏、脾脏、肾脏、心脏、脑组织病料,通过肝脏组织触片镜检、细菌分离培养、生化试验进行细菌鉴定和药敏试验;采用PCR方法进行相关病毒核酸检测.结果:肝脏组织触片镜检观察到两极浓染的短小杆菌,细菌分离培养出革兰氏阴性短小杆菌,生化试验结果符合多杀性巴氏杆菌的特性,药敏试验显示分离菌对多西环素、四环素、新霉素、头孢拉定、诺氟沙星、庆大霉素、青霉素、丁胺卡那敏感;相关病毒PCR检测为阴性.结论:养殖场病鸡存在多杀性巴氏杆菌感染,采用敏感药物治疗后控
为了解四川、贵州、重庆3个省(市)中小规模猪场伪狂犬病病毒的感染情况,2020年1月至2021年3月采用ELISA方法对41个猪场的1016份血清进行伪狂犬病血清学调查.结果:11个猪场的伪狂犬病病毒gE抗体检测呈阳性,场阳性率为26.8%;共检测出阳性样品105份,个体阳性率为10.3%;川、黔、渝地区猪场的个体阳性率分别为13.5%、3.0%、11.8%.结论:四川、贵州、重庆3个省(市)的中小规模猪场均存在伪狂犬病病毒感染,部分猪场感染较为严重,应持续加强对该病的检疫和监测,以净化猪群.
丝路文化是联系一带一路战略的重要纽带,其传承意义重大,但是由于历史地理原因,丝路文化中代表性的历史遗产分散或损坏,难以有效地呈现,因此,本文面向丝路文化的虚拟展示与数字化,提出并实现了基于虚拟现实技术的丝路文化传承平台,通过历史遗迹复原以及基于图像的三维重建,还原了丝路文化中重要节点宁夏固原有关的历史遗迹、文物和事件.特别地,本文提出一种面向高清图像的多视角立体三维重建算法,包括采用normal-aware PatchMatch stereo复原高质量的法线图,反映文物表面精细结构,以及提出一种基于GPU
采用普通PID控制的复杂电液伺服控制系统(液压驱动的控制系统)存在控制柔顺性不佳的问题,达不到理想的控制效果,为了提高电液伺服系统的控制特性,提出了一种基于径向基神经网络(RBF)模糊PID的控制策略.首先,理论推导了伺服阀控液压缸的状态空间方程,建立了液压系统相关的数字模型;然后,在普通PID控制策略的基础上,提出了一种基于径向基(RBF)神经网络的模糊PID控制策略,并结合电液伺服系统的特性,调整了其模糊控制规则;最后,在空载和负载两种工况下,对该电液伺服系统进行了MATLAB/Simulink仿真,
由于起重机吊钩缺乏旋转动力装置,在强风作用下会导致其悬挂载荷发生旋转,针对这一问题,提出了一种带陀螺阻尼器的起重机悬挂载荷防摆控制装置.首先,采用由伺服电机驱动的吊钩对悬挂载荷进行旋转定位,采用了单轴机械陀螺的被动控制方式,对悬挂载荷旋转时产生的反作用力矩进行了抑制;然后,从两个方面对该装置进行了优化(在机械陀螺仪的万向节侧面添加弹簧,构建起了一种陀螺阻尼器;利用风力控制来调整悬挂载荷的姿态);最后,构建了陀螺阻尼器和风力组合控制的装置物理模型,并通过实验对该装置进行了分析.研究结果表明:与无弹簧的情况相
时间序列预测是典型的时间序列分析任务,对于辅助决策、资源配置、提前采取止损措施等方面有重要意义,在包括电力、气象、交通、商业等领域有广泛应用.近年来,时间序列预测算法一直是机器学习的热门研究领域,其中多变量时间序列预测是一个具有挑战性的任务.本文研究多变量时间序列预测的局部变量预测精度问题,即多变量预测需要在提升整体预测性能的同时保证局部单变量的预测精度.针对现有多变量时间序列预测算法不能保障局部变量预测精度的局限性,我们设计并实现了一种基于自演化预训练的多变量时间序列预测算法SEPNets.基于预训练的
为了解卵形巴贝斯虫吉林株HSP70基因的结构及功能特性,采用PCR方法对其HSP70基因进行扩增测序及系统进化分析.结果:结构分析显示,卵形巴贝斯虫吉林株HSP70基因片段大小为1947 bp;测序结果显示,卵形巴贝斯虫吉林株HSP70基因与卵形巴贝斯虫日本株(XM_029011319)同源性为99.8%,与双芽巴贝斯虫同源性为95.12%,与牛巴贝斯虫同源性为86.72%;系统进化树分析表明,卵形巴贝斯虫吉林株与双芽巴贝斯虫亲缘关系较近,与牛巴贝斯虫及其他虫种亲缘关系较远.
大数据场景下,远程云服务器通常被部署用于数据处理与价值挖掘,但在面对时延敏感型或需要动态频繁交互的业务时,该种处理模式显得力不从心.作为对云计算模式的补充,雾计算因其可有效降低任务处理时延、能耗与带宽消耗而备受关注;同时,面向雾计算的计算迁移机制因其能有效缓解节点的处理负担并改善用户体验而成为领域研究焦点.在雾计算模式下,为了更好地满足计算密集型任务对时延与能耗的要求,基于区块链赋能物联网场景,本文提出了一种联合资源分配与控制的智能计算迁移方案.具体地,规划了一个在时延、能耗与资源约束下的最小化所有任务完
针对电主轴运转过程中流量设计对主轴温升、寿命影响的问题,对电主轴冷却系统流量对主轴温度的影响进行了仿真分析和测试研究.首先,基于实际的电主轴使用情况,将其工况划分为低转速小扭矩、空载最高转速、低速最大扭矩3种工况,并对不同工况下主轴各关键部件的发热量进行了计算;然后,建立了主轴整机的温度场有限元仿真模型,将最佳流量的分析细化至了主轴的常用切削工况上,同时为避免主轴因流量供给不足造成寿命缩短、故障等问题,提出了最低流量的计算方法;最后,搭建了电主轴温升试验测试平台,对常用工况下主轴各关键部位的温升进行了测试