一种基于交叉熵的top-k频繁项集挖掘算法

来源 :郑州大学学报(理学版) | 被引量 : 0次 | 上传用户:jpy_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过指定期望结果项集数量挖掘top-k频繁项集,可解决频繁项集挖掘中支持度阈值难以设定的问题.由于能在较短的时间内得到足够多的精确结果,因此利用启发式方法挖掘项集的工作受到了越来越多的关注,但利用启发式方法来挖掘top-k频繁项集却鲜有研究.提出了一种基于交叉熵的top-k频繁项集挖掘算法KCE.首先,给出了将交叉熵应用于top-k频繁项集挖掘的建模方法;其次,提出了基于过滤支持度的搜索空间剪枝策略;第三,设计了利用按位交叉来产生下一代项集的策略,以提高样本的多样性.实验结果表明,KCE算法在运行时间和空间消耗上都有优势,且挖掘结果的平均精度在95%以上.
其他文献
地图在演变rn为了解GIS技术,我们先来回顾地图绘制学科的发展史与地图功能的演变史.rn制作于公元前6世纪的巴比伦泥板世界地图,被认为是目前发现的最古老的世界地图之一.它由两个同心圆组成,内圆代表陆地,陆地被代表海洋的外圆环绕.自上而下,有两条平行线,代表古幼发拉底河.巴比伦位于地图中央偏上方位置.对于古巴比伦人来说,这张地图代表了整个世界,它不仅是现实世界,也是神话世界.
期刊
科学家预测,2050年全球人口将增长到100亿,而可用土地面积依然保持不变.因此,未来人类直接食用的蛋白质替代品可能就是昆虫.rn吃陆生昆虫的做法在世界大部分地区被广泛接受.在某种意义上,大多数可食用的陆生昆虫比螃蟹、龙虾和虾更干净,因为它们以新鲜植物和木材为食,而不是腐肉.当然,食用昆虫并不会取代牲畜,它只是一种更可持续的选择.昆虫的寿命很短,繁殖速度快,并且只需要简单且最少的栖息地和营养需求,对蛋白质的获取速度比牛或猪快得多.
期刊
为了实现联合国制定的17个可持续发展目标,人类需要解决大量现实问题,而太空技术中的一些科技产品和服务可以发挥事半功倍的作用.rn遍布全球的“空间通信”rn空间通信是一种以航天器(或天体)为对象的无线电通信,比如卫星技术已经彻底改变我们的日常生活,使国际和国内长途电话、视频传送、流媒体以及卫星电视和广播融入生活的每一个角落.
仅凭触觉而不是视觉织网的蜘蛛一直让人类着迷.近日,美国约翰霍普金斯大学的研究人员通过跟踪和记录蜘蛛在黑暗中工作时8条腿的每一个动作,发现了蜘蛛织网的秘密.rn为了在夜间观察蜘蛛,实验室设计了配备红外摄像机和红外灯的场地.通过这种设置,他们每晚监视并记录6只蜘蛛织网.研究人员需要在很长一段时间内对许多对象进行追踪,由于每一帧需要手动注释腿部的点位很多,所以他们采用训练机器视觉软件来监测蜘蛛的姿态.
期刊
科学家提出设想,在未来,人类可以将自己的干细胞提前储存,需要新的神经元、肌肉细胞、皮肤细胞时,都可以从这个“干细胞银行”中将它们提取出来,而且身体免疫系统不会排斥或攻击这些新细胞.事实上,你的身体甚至意识不到这些新细胞是在细胞工厂制造的.近年来生物学、激光物理学和机器学习交叉领域的突破,使这一设想有了实现的可能.
近日,哈尔滨工业大学(深圳)副教授梁旭东及其合作团队,和美国马萨诸塞大学阿默斯特分校的研究人员共同宣布,他们设计了一种新型橡胶状固体物质,可以吸收和释放大量的能量.这种超材料可以让机器人在不使用额外能源的情况下获得更多动力,还可以制成更快耗散能量的防护用具,有广泛的应用前景.这种超材料结合了橡胶的弹性和嵌入其中的微小磁铁的磁力,利用相移(一种物理特性,即输出的正弦波和输入的正弦波信号的相位差)来放大材料可以释放或吸收的能量.
由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题.从这些问题出发,提出了一种跨语言舰船实体匹配算法.首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率.还设计了捕捉字符和发音特征的混合相似度度量MixSim协助寻找匹配的实体.利用从互联网上爬取各国舰船活动事件的新闻报道和简式舰船数据进行实验,结果表明算法取得了较好的效果,而且证明了两种相似度度量在字
本刊讯 3月2日,《河南省工程建设项目联合测绘技术规范(送审稿)》(以下简称《规范》)通过了河南省自然资源专业标准化技术委员会专家组技术论证.这是河南省首部全流程联合测绘技术性地方标准,将统一和规范工程建设项目“联合测绘”技术标准,确保测绘成果质量,促进成果共享,为工程建设领域推行“多测合一”改革提供标准化支撑.
双循环背景下,国内消费市场的持续扩大有望进一步增加港口内贸集装箱比例,而海洋集装箱运输极易受到外界因素的影响,因此对国内海洋集装箱运输网络脆弱性的研究必要而紧迫.本文在港口中断模拟下,运用复杂网络特征指标从网络结构和节点抗干扰性能两方面,分析2005年和2017年中国沿海集装箱港口航运网络脆弱性,并探讨脆弱性的主要影响因素.结果表明:①相较于2005年,2017年有较高比例的节点分别失效,使网络集聚系数上升、平均路径长度减小和网络独立路径数量增大,这表明当网络中有较多节点分别中断失效,剩余节点仍具有紧密联
目的 综合评价三联疗法(TT)和双重抗血小板治疗(DAPT)的策略在心房颤动(AF)病人接受经皮冠状动脉介入治疗(PCI)后对卒中、主要不良心脑血管事件(MCAE)、出血事件、全因病死率的影响.方法 检索PubMed,Embase,Web of Science数据库中2000―2018年的文章.根据纳入和排除标准进行筛选.提取AF病人TT组和DAPT组卒中、MCAE、出血事件、全因病死率等临床结果数据,采用ReVman 5.3进行合并效应分析.结果 TT组总出血事件发生率(RR=1.0,95%CI:0.8