ToP-k概率频繁co-location模式挖掘算法优化及数据库实现

来源 :云南大学 | 被引量 : 0次 | 上传用户:irolu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间co-location模式代表一组空间特征,它们的实例在空间中频繁的关联。空间co-location模式挖掘研究是空间数据挖掘的一个重要方向,目前有大量关于确定数据的co-location模式挖掘的研究,但是针对不确定数据的空间co-location模式挖掘研究工作仍出于起步阶段。不确定数据在现实场景中处处存在,并且确定空间数据的co-location挖掘算法不能适用到不确定数据,因此不确定数据的空间co-location模式挖掘研究意义重大。本文主要研究不确定空间数据下top-k概率频繁co-location模式的挖掘以及数据库实现,内容如下:  首先分析了研究现状,概括了co-location模式挖掘研究的内容及成果,介绍了不确定数据的知识以及空间co-location模式挖掘的相关定义。  其次,介绍了可能世界、top-k概率频繁模式以及矩阵方法,分析了矩阵的特点,并对此方法进行优化,设计了一种索引方式求参与度,改进了矩阵的构造,提出Matrixblock、Matrix两种剪枝方法,达到一次判断,批量剪枝可能世界的效果,同时设计了一种网格圈定求表实例的方法。  第三点:设计了一个关于top-k概率频繁co-location模式挖掘的后台数据库原型系统,详细介绍了表的设计和主要存储过程的实现。  第四点:通过对合成数据和真实数据进行实验,验证了优化算法的高效性,分析了各个参数以及数据集分布对算法性能的影响,同时得出了数据库实现系统的优缺点。  最后对本文工作做了简要总结,指出了不足以及未来的研究方向。
其他文献
在过去的20年间并行计算在硬件层面迎来了巨大的发展,从原来单一提升CPU主频到如今的单CPU多核化、众核主流化、多线程、高并发、分布式再到GPU、MIC等异构加速部件的出现。但
学位
LTE基带芯片对处理能力和功耗有着非常苛刻的要求。然而,集成电路产业技术门槛高、研发周期长、资金投入大等问题和LTE基带芯片的需求形成了鲜明的矛盾。基带芯片的研发难度越
提供资源共享、信息共享是计算机网络主要功能.实现计算机系统互联,让用户可靠 地、廉价地、透明地共享网上主机资源,是计算机网络面临的关键问题之一.网络文件系统(NFS)在此
学位
学位
学位
伴随着智能电视的发展,电视节目的数量剧增,节目类型广泛,覆盖内容越来越多。海量的节目使用户根据喜好有更丰富的选择,但同时也需要观众花费大量的时间和操作,从中搜索到自己喜欢
针对舆情应用,舆情话题挖掘需要解决三方面的问题:话题检测目标制导,突发话题早期预警,特定话题细粒度分析。微博产生后,一直在社会舆情事件发源、发酵等方面扮演着重要角色,成为
学位