基于信息熵与遗传算法的并行关联规则增量挖掘算法

来源 :通信学报 | 被引量 : 0次 | 上传用户:fanjin001983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大数据环境下基于Can树的增量关联规则算法存在树结构空间占用过大、支持度阈值无法动态设置以及Map与Reduce阶段数据传输耗时等问题,提出了一种基于信息熵和遗传算法的并行关联规则增量挖掘算法MR-PARIMIEG。首先,该算法设计基于信息熵的相似项合并策略(SIM-IE)来合并相似数据项,并根据合并后的数据集进行Can树构造,从而减少树结构的空间占用;其次,提出基于遗传算法的DST-GA策略获取大数据环境下相对最优的动态支持度阈值,根据此阈值进行频繁项集挖掘,避免了冗余的频繁模式挖掘导致的时间
其他文献
连续刚构桥设计理论明确,施工工艺成熟、安全,施工场地占用少,运营期行车舒适、养护费用少,是云南山区高墩大跨桥梁常用的方案。以元蔓高速公路稿吾卡1号大桥工程为实例,详细
以公路隧道提质升级行动为背景,分析了隧道机电设施在实际运营维护中存在的问题,提出了隧道智能监控管理运营一体化设计新思路。在此基础上,将单个隧道机电设施运营维护管理
运用VISSIM对无信号环形交叉口以及有信号十字交叉口的通行延误情况进行模拟仿真。以车均运行延误时间、车均停车延误时间、车均停车次数以及排队长度为评价指标,分析对比两
在发动机起动模型过程中需通过外推方法获取发动机的低转速部件特性,目前尚无对外推得到部件特性的评价方法和使用过程中的修正方法。针对此问题,在分析压气机、涡轮等部件特
随着先进飞行器的不断发展和飞行性能要求的不断提高,空中加油已经成为当前先进飞行器的一项重要且关键的技术,并对受油机的姿态控制精度和作动系统提出了极高的要求。然而,
为解决毫米波多天线系统大量移相器(PS)引起的高功耗问题,设计了一种新型动态连接结构,以最大化频谱效率为目标提出了连续干扰消除(SIC)和连续干扰消除-交替方向乘子(SIC-ADMM)2种混合预编码方案。SIC将总速率问题分解为不同射频链路的子速率问题,先对模拟部分进行逐次迭代,转化为低维度等效矩阵后再对数字部分进行求解。SIC-ADMM是对SIC的改进,通过研究多变量子速率问题实现算法的快速收敛
各位代表:现在,我代表最高人民法院,向大会报告工作,请予审议,并请全国政协各位委员提出意见。2020年工作回顾2020年是新中国历史上极不平凡的一年。面对世纪疫情和百年变局
针对海洋网络节点间计算能力与通信资源的差异性,提出了一种基于海洋网络连通概率的边缘计算节点选取方法。根据海洋近岸与远岸的网络节点密度不同,分别建立2种卸载模型。在近岸场景下,提出多节点协同的卸载方法,利用基于海洋多节点协同卸载遗传算法求解;在远岸场景下,提出可容错的卸载方法,利用基于分组交叉学习粒子群算法求解。仿真结果表明,所提方法较传统方法可降低30%以上的网络延时并可节约20%以上的网络成本,
期刊
针对基于网络编码的协作恢复(CR)机制线性可解性未知问题,建立了CR机制网络编码包的线性可解性的量化分析模型,给出了在任意阶伽罗华编码有限域下接收方解码出所有源数据包的概率上下界,并提出了一种改进Gauss-Jordan的线性可解性在线判定算法。数值实验结果验证了所提上下界的紧密性和改进Gauss-Jordan算法解码的低等待时延特性,节点部署实验显示改进Gauss-Jordan算法较传统Gaus