【摘 要】
:
关系人分析主要是从海量通信数据中分析出人与人之间的潜在的关系模式,为其他分析系统提供决策支持。将数据挖掘技术应用到关系人的分析中能更容易的挖掘出隐藏在数据中的信
论文部分内容阅读
关系人分析主要是从海量通信数据中分析出人与人之间的潜在的关系模式,为其他分析系统提供决策支持。将数据挖掘技术应用到关系人的分析中能更容易的挖掘出隐藏在数据中的信息。关系人分析系统主要包括三个模块:用户界面模块、数据准备模块和关联规则挖掘模块。其中用户界面主要负责接受用户的参数输入以及挖掘结果的展示;数据准备模块主要负责数据的采集和预处理;关联规则模块主要负责模式的挖掘。针对关系人分析系统所挖掘的数据具有数据量很大,且随时间不断增加的特点,本文采用基于分区算法的增量式关联规则快速更新算法来实现系统的核心模块—关联规则挖掘模块。分区算法将数据分为多个分区,分别对每个分区进行处理,不仅减少了内存压力还能实现多处理机并行挖掘,提高整个系统的挖掘效率。增量式关联规则快速更新算法是在数据变更时复用以往已经挖掘的结果,而不用在整个数据集上重新挖掘,这样就有效地提高了系统的效率。通过对分区算法的深入分析,可以发现该算法在挖掘过程中会产生大量的无效的候选项集,影响挖掘效率。针对这一问题,采用哈希技术对分区算法进行改进,提出了基于哈希技术的分区算法。对比实验表明,系统的效率在分区算法改进后比改进前有所提升,使系统能在更快的时间内挖掘出有用的模式,具有一定的实用价值。
其他文献
随着互联网技术的普及与进步,我国网民数量得到很大突破的同时,计算模型也随之产生了深刻的变革。自云计算以来,现如今移动计算可谓是如日中天的新型计算模型。利用移动互联
网络环境随着技术发展变得越来越复杂,各类恶意代码层出不穷,对抗恶意代码已成为计算机安全研究的主要内容之一。同时,在网络取证及信息对抗中,恶意代码作为一种辅助手段,正
随着无线通信技术、嵌入式技术以及传感器技术的不断发展和进步,生产具备无线通信和信息处理能力的微型无线传感器网络节点已经成为可能。这些廉价、低功耗的节点大量部署在观
随着电子图书馆,企业办公自动化,互联网的发展,数据库管理系统DBMS中已积累大量的非结构化数据。采用在DBMS的外部建立索引的方法很难保证DBMS中的数据与索引的一致性,不适合对性
随着RFID(无线射频识别技术)越来越广泛地应用在各个领域,对RFID 事件处理技术的研究得到了高度的关注。为RFID 应用提供基于中间件的平台,在RFID的物理设备与应用软件之间建立桥
在电子商务的智能谈判领域,研究工作从最简单的双边单议题问题发展到复杂的多边多议题协商。谈判模型的实现机制各不相同,涵盖了较多的技术方法,诸如网格技术、并发方法、模
在容灾存储系统中,为了保证系统的高可靠性与高可用性,广泛地采用了故障检测技术,通过及时而准确地发现故障并采取相应的处理措施来保证可靠性。广域网具有高时延,高抖动等特
三维建筑建模是当前计算机图形学研究中的一个重要课题,广泛应用于各种虚拟场景的构建。本文主要提出了一种基于特征线素的轻量级三维建筑交互建模方法,称为Fe-Wires方法。该
在线视频网站如优酷、爱奇艺、搜狐大多采用Adobe公司提供的通用的FlashPlayer平台,因此用户在线观看视频时,不需要下载不同的解码软件对视频解码播放。据调查了解,Flash Pla
关键节点的测度问题本质上可归结为节点重要性测度及排序问题,该问题的有效解决有助于指导金融、电力、供应链、互联网等多方面的应用开展。而当前的研究大多针对无权、静态