基于先验位运算的频繁项集挖掘

来源 :计算机应用研究 | 被引量 : 5次 | 上传用户：wsd988

【摘要】

：

为提高频繁项集的产生效率,提出一种在垂直数据表示下,基于先验位运算的频繁项集挖掘算法(A-FIMBII)。该算法建立从项集合到事务的索引,利用先验性质减少候选集的产生,通过位运算计算支持度。与Apriori、Eclat算法进行了比较,实验表明,A-FIMBII具有更高的效率。

【作者】

：

张岳王洪国邵增珍赵建秀

【机构】

：

山东师范大学信息科学与工程学院,山东省分布式计算机软件新技术重点实验室

【出处】

：

计算机应用研究

【发表日期】

：

2013年09期

【关键词】

：

频繁项集 Eclat算法先验索引表 vfrequent itemset Eclat algorithm Apriori inverted index

【基金项目】

：

山东省自然科学基金资助项目（ZR2011FQ029,ZR2011FL026）,山东省科技发展计划资助项目（2011YD01099,2011YD01100）,山东省高等学校科技计划资助项目（J11LG32）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

考虑优先权的地震灾害时限应急救援指派模型

针对地震灾害的突发性及受灾点的分散性,模型定量确定救援优先级,以最短到达时间为约束条件构建基于优先权的时限多目标指派模型;运用两阶段法对模型进行求解,算例结果表明,利用该模型进行应急救援队伍的派遣是可行的,可为应急救援的组织与协调提供决策参考。

期刊

地震灾害应急救援优先权时限指派模型earthquake disaster emergency rescue priority time limi

3时隙的双向中继系统中用户选择的性能分析

对于双向中继系统,在某些场景下3时隙方案的传输速率高于2时隙方案,为此提出了3时隙的多用户双向中继系统,该系统包含一个基站、若干用户和一个中继节点。基站和被选择的一个用户通过中继节点进行信息交换,用户选择的准则是使得系统的平均传输速率最大化。从理论上分析了该方案的平均传输速率,仿真得到的平均传输速率与理论值非常接近,验证了理论分析的正确性。

期刊

多用户双向中继系统用户选择平均传输速率multiuser two-way relay system user selection average

数据仓库性能优化之索引和物化视图耦合方法

为了进一步提高数据仓库的性能,通过分析数据仓库中性能优化技术的特点,提出了索引和物化视图耦合的性能优化技术。通过数据挖掘自动选择候选索引和物化视图,减少查询的扫描范围;然后研究在物化视图上建立索引的空间高效存储方法,以提高查询速率;最后利用成本模型对耦合情况进行分析,验证了耦合方法可以极大提高单一索引查询或者物化视图的性能。

期刊

索引耦合物化视图成本模型数据仓库index coupling materialized view cost model data war

元图的存储结构及其搜索算法

给出了元图在计算机中的实现,提出元图的关联矩阵和邻接表存储结构,并给出了元图对应两种存储结构的广度优先搜索算法(BFS)和深度优先搜索算法(DFS)。最后,对给出的元图的存储结构和搜索算法进行了分析,验证了提出的存储结构和搜索算法的可行性。

期刊

元图存储结构搜索算法metagraphstorage structuresearch algorithm

一个适用于DTN网络的拥塞避免与解除方案

DTN(delay-tolerant network,延迟容忍网络)的网络特点及其采用的托管传输机制易造成网络受限资源(如缓存、带宽等)的耗尽,形成网络拥塞,导致网络性能的下降。传统TCP拥塞控制机制不适用于DTN网络。提出了一个全新的适用于DTN网络的拥塞避免与拥塞解除方案。拥塞避免根据在足够小的时间段内DTN链路的传输延迟和传输能力的确定性,建立DTN网络有向多径图,对数据发送速率、接收速率、

期刊

延迟容忍网络拥塞控制拥塞避免拥塞解除负载平衡DTN（delay-tolerant network） congestion control cong

基于移动agent的无结构P2P网络拓扑重连方法研究

为了提高无结构P2P网络中资源查找的效率,同时避免在资源查找过程中出现拥塞,提出了一种基于移动agent的网络拓扑重连方法。网络节点定期进行拓扑重连,同时通过收集其邻居节点的处理能力以及连通性等信息,指导移动agent有目的地在网络迁移,从而使移动agent及时发现网络节点上的拥塞,并使用拓扑优化机制降低节点上的负载。实验证明该方法能优化网络的拓扑结构,避免网络查询过程中发生拥塞,提高资源查找的效

期刊

P2P网络资源查找移动AGENT拓扑重连P2P network resource location mobile agent topology a

一种基于局部冲突分配的证据组合规则

Dempster-Shafer证据理论广泛应用于信息融合中,但是在证据高冲突情况下基于经典D-S证据组合规则的融合结果存在问题。针对这一问题,提出了一种基于局部冲突分配的证据组合规则。首先基于Jousselme证据距离获得各个证据体的信任度和加权平均证据,然后由定义的焦元距求其每一个焦元的绝对距离,并以此获得焦元信任度。最后实验结果表明,所提算法提高了证据合成结果的可靠性和合理性。

期刊

证据理论组合规则局部冲突焦元信任度绝对距离evidence theorycombination rulelocal conflictfocal’

一种基于复杂网络的P2P流媒体拓扑构建算法

按照何种拓扑结构来构建覆盖网络是P2P流媒体网络中的热点问题,而已有的拓扑构建算法大多采用启发式算法,参数由经验值确定,缺乏理论分析。针对此问题,运用复杂网络中小世界效应的理论知识和簇结构的概念,提出了一种基于复杂网络的P2P流媒体拓扑构建算法,用所有的簇头节点构成一个小世界网络,利用小世界网络的特性来改善P2P流媒体网络的性能。对该算法和经典的CoolStreaming方法分别进行了仿真实验,比

期刊

对等网络流媒体拓扑构建小世界簇peer-to-peer network streaming media topology construction

基于CRF和错误驱动的中心词识别

针对中文问题分类的中心词识别不准确的问题,提出了一种基于条件随机场(CRF)和错误驱动学习相结合的识别方法。该方法采用CRF模型对问题的中心词进行初始标注,依据词的上下文信息用错误驱动的学习方法对其标注结果进行纠正。在训练有序规则的过程中,为了减少训练时间,结合中心词的特点对错误驱动算法进行了改进。实验结果表明,该方法在一定程度上提高了中心词的标注精度,达到88%。

期刊

问题分类中心词条件随机场(CRF)错误驱动学习(TBL)上下文信息有序规则question classification focus condi

用于多标记学习的局部顺序分类器链算法

标记间的相关性在分类问题中具有重要作用,目前有研究将标记相关性引入多标记学习,通过分类器链的形式将标记结果引入属性空间,为学习其他标记提供有用信息。分类器链中标记的预测顺序具有随机性,分类结果存在着很大的不确定性与不稳定性,且容易造成错误信息的传播。为此充分考虑标记的局部分布特性,提出了一种局部顺序分类器链算法,解决分类器链中分类器顺序问题。实验表明,该算法性能优于其他常用多标记学习算法。

期刊

多标记学习标记相关性分类器链K-近邻multi-label learning label correlation classifier chains

基于先验位运算的频繁项集挖掘

与本文相关的学术论文