大规模语料中频繁模式增量发现算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:wanglin0824
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种适用于大规模语料的频繁模式增量发现算法。统计局部区域提取的字符串频度,对局部相对低频字符串进行剪枝。利用多模式串匹配算法,统计剪枝后局部相对高频字符串在整个语料中的频度,得到频度大于阈值的频繁模式。实验结果表明,该算法具有较低的空间复杂度和时间复杂度,内存消耗为基于后缀数组的频繁模式发现算法的20%左右。
其他文献
传统Aprior频繁子图挖掘算法中存在大量冗余子图。针对该问题,提出一种新的频繁子图挖掘算法(GAI)。介绍一种三层MADI索引结构,用于存储图集的信息,以减少图集的扫描次数,通过
This research work was set out to find and analyze the relationship between Foreign Direct Investment (FDI) and growth in Uganda’s energy sector as a vital par
对天津老字号未来展望与推进策略“天津老字号”资源丰富.是天津企业在市场竞争中取胜的优势.让老字号充分发挥作用是加快天津经济发展的重要途径。因此建议应思考并做好下几方
第二届“故乡的路:中国少数民族摄影师奖”在2017年春夏之交如期评选,二十位摄影师的作品入围。对于每月都有各类“国际影会”的中国摄影界而言,这个由民间机构组织的摄影展
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的了解心理护理对产妇自然分娩选择的影响。方法取本院2016年5月至2018年6月进行分娩产妇70例为分析对象,其中35例接受常规围产期护理产妇为对照组,35例联合心理护理干预产
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
作为事业单位各项工作开展进程中的文字载体,文书档案全面记录了事业单位各个工作方面的相关内容,文书档案管理工作的好坏在较大程度上决定着事业单位的发展。随着我国经济转
提出一种基于遗传算法和神经网络预测法相结合的再励学习方法,利用遗传算法对全局进行最优解搜索,将进化过程中产生的数据用来训练神经网络预测器,当再励学习逼近最优解时,利用预
如今中小企业在国民经济中地位愈来愈高,而资金不足、融资难等现状也越来成为束缚之发展的瓶颈。动产质押融资作为金融和物流业相结合的创新性服务产品,为中小企业的成长建立了