【摘 要】
:
为提高频繁项集的产生效率,提出一种在垂直数据表示下,基于先验位运算的频繁项集挖掘算法(A-FIMBII)。该算法建立从项集合到事务的索引,利用先验性质减少候选集的产生,通过位运算计算支持度。与Apriori、Eclat算法进行了比较,实验表明,A-FIMBII具有更高的效率。
【机 构】
:
山东师范大学信息科学与工程学院,山东省分布式计算机软件新技术重点实验室
【基金项目】
:
山东省自然科学基金资助项目(ZR2011FQ029,ZR2011FL026),山东省科技发展计划资助项目(2011YD01099,2011YD01100),山东省高等学校科技计划资助项目(J11LG32)
论文部分内容阅读
为提高频繁项集的产生效率,提出一种在垂直数据表示下,基于先验位运算的频繁项集挖掘算法(A-FIMBII)。该算法建立从项集合到事务的索引,利用先验性质减少候选集的产生,通过位运算计算支持度。与Apriori、Eclat算法进行了比较,实验表明,A-FIMBII具有更高的效率。
其他文献
针对地震灾害的突发性及受灾点的分散性,模型定量确定救援优先级,以最短到达时间为约束条件构建基于优先权的时限多目标指派模型;运用两阶段法对模型进行求解,算例结果表明,利用该模型进行应急救援队伍的派遣是可行的,可为应急救援的组织与协调提供决策参考。
对于双向中继系统,在某些场景下3时隙方案的传输速率高于2时隙方案,为此提出了3时隙的多用户双向中继系统,该系统包含一个基站、若干用户和一个中继节点。基站和被选择的一个用户通过中继节点进行信息交换,用户选择的准则是使得系统的平均传输速率最大化。从理论上分析了该方案的平均传输速率,仿真得到的平均传输速率与理论值非常接近,验证了理论分析的正确性。
为了进一步提高数据仓库的性能,通过分析数据仓库中性能优化技术的特点,提出了索引和物化视图耦合的性能优化技术。通过数据挖掘自动选择候选索引和物化视图,减少查询的扫描范围;然后研究在物化视图上建立索引的空间高效存储方法,以提高查询速率;最后利用成本模型对耦合情况进行分析,验证了耦合方法可以极大提高单一索引查询或者物化视图的性能。
给出了元图在计算机中的实现,提出元图的关联矩阵和邻接表存储结构,并给出了元图对应两种存储结构的广度优先搜索算法(BFS)和深度优先搜索算法(DFS)。最后,对给出的元图的存储结构和搜索算法进行了分析,验证了提出的存储结构和搜索算法的可行性。
DTN(delay-tolerant network,延迟容忍网络)的网络特点及其采用的托管传输机制易造成网络受限资源(如缓存、带宽等)的耗尽,形成网络拥塞,导致网络性能的下降。传统TCP拥塞控制机制不适用于DTN网络。提出了一个全新的适用于DTN网络的拥塞避免与拥塞解除方案。拥塞避免根据在足够小的时间段内DTN链路的传输延迟和传输能力的确定性,建立DTN网络有向多径图,对数据发送速率、接收速率、
为了提高无结构P2P网络中资源查找的效率,同时避免在资源查找过程中出现拥塞,提出了一种基于移动agent的网络拓扑重连方法。网络节点定期进行拓扑重连,同时通过收集其邻居节点的处理能力以及连通性等信息,指导移动agent有目的地在网络迁移,从而使移动agent及时发现网络节点上的拥塞,并使用拓扑优化机制降低节点上的负载。实验证明该方法能优化网络的拓扑结构,避免网络查询过程中发生拥塞,提高资源查找的效
Dempster-Shafer证据理论广泛应用于信息融合中,但是在证据高冲突情况下基于经典D-S证据组合规则的融合结果存在问题。针对这一问题,提出了一种基于局部冲突分配的证据组合规则。首先基于Jousselme证据距离获得各个证据体的信任度和加权平均证据,然后由定义的焦元距求其每一个焦元的绝对距离,并以此获得焦元信任度。最后实验结果表明,所提算法提高了证据合成结果的可靠性和合理性。
按照何种拓扑结构来构建覆盖网络是P2P流媒体网络中的热点问题,而已有的拓扑构建算法大多采用启发式算法,参数由经验值确定,缺乏理论分析。针对此问题,运用复杂网络中小世界效应的理论知识和簇结构的概念,提出了一种基于复杂网络的P2P流媒体拓扑构建算法,用所有的簇头节点构成一个小世界网络,利用小世界网络的特性来改善P2P流媒体网络的性能。对该算法和经典的CoolStreaming方法分别进行了仿真实验,比
针对中文问题分类的中心词识别不准确的问题,提出了一种基于条件随机场(CRF)和错误驱动学习相结合的识别方法。该方法采用CRF模型对问题的中心词进行初始标注,依据词的上下文信息用错误驱动的学习方法对其标注结果进行纠正。在训练有序规则的过程中,为了减少训练时间,结合中心词的特点对错误驱动算法进行了改进。实验结果表明,该方法在一定程度上提高了中心词的标注精度,达到88%。
标记间的相关性在分类问题中具有重要作用,目前有研究将标记相关性引入多标记学习,通过分类器链的形式将标记结果引入属性空间,为学习其他标记提供有用信息。分类器链中标记的预测顺序具有随机性,分类结果存在着很大的不确定性与不稳定性,且容易造成错误信息的传播。为此充分考虑标记的局部分布特性,提出了一种局部顺序分类器链算法,解决分类器链中分类器顺序问题。实验表明,该算法性能优于其他常用多标记学习算法。