大规模语料中频繁模式增量发现算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户：wanglin0824

【摘要】

：

提出一种适用于大规模语料的频繁模式增量发现算法。统计局部区域提取的字符串频度,对局部相对低频字符串进行剪枝。利用多模式串匹配算法,统计剪枝后局部相对高频字符串在整

【作者】

：

廖豪陈洁谭建龙

【机构】

：

中国科学院计算技术研究所,中国科学院研究生院,北京邮电大学计算机学院

【出处】

：

计算机工程

【发表日期】

：

2011年23期

【关键词】

：

频繁模式增量式多模式串匹配算法后缀树后缀数组 frequent pattern incremental multi-pattern string mat

【基金项目】

：

国家“973”计划基金资助项目（2007CB311100）, 国家自然科学基金资助项目（20110250）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出一种适用于大规模语料的频繁模式增量发现算法。统计局部区域提取的字符串频度,对局部相对低频字符串进行剪枝。利用多模式串匹配算法,统计剪枝后局部相对高频字符串在整个语料中的频度,得到频度大于阈值的频繁模式。实验结果表明,该算法具有较低的空间复杂度和时间复杂度,内存消耗为基于后缀数组的频繁模式发现算法的20%左右。

其他文献

一种新的频繁子图挖掘算法

传统Aprior频繁子图挖掘算法中存在大量冗余子图。针对该问题,提出一种新的频繁子图挖掘算法（GAI）。介绍一种三层MADI索引结构,用于存储图集的信息,以减少图集的扫描次数,通过

期刊

APRIORI算法数据挖掘子图同构频繁子图Apriori algorithm data mining subgraph isomorphism freq

FDI与乌干达能源产业发展研究

This research work was set out to find and analyze the relationship between Foreign Direct Investment (FDI) and growth in Uganda’s energy sector as a vital par

学位

FDIEnergyIndustryDevelopment and Uganda

天津老字号发展情况分析及对策刍议(下)

对天津老字号未来展望与推进策略“天津老字号”资源丰富．是天津企业在市场竞争中取胜的优势．让老字号充分发挥作用是加快天津经济发展的重要途径。因此建议应思考并做好下几方

期刊

老字号文化遗产改组改制分析及对策

“自观与他视”民族志影像的新实践第二届“故乡的路:中国少数民族摄影师奖”

第二届“故乡的路:中国少数民族摄影师奖”在2017年春夏之交如期评选,二十位摄影师的作品入围。对于每月都有各类“国际影会”的中国摄影界而言,这个由民间机构组织的摄影展

期刊

摄影师纳西族

“罗托尔克”阀门电动机的分析

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

电动执行机构技术协作电动机转速热继电器托尔克

产科助产实施心理护理促进自然分娩

目的了解心理护理对产妇自然分娩选择的影响。方法取本院2016年5月至2018年6月进行分娩产妇70例为分析对象,其中35例接受常规围产期护理产妇为对照组,35例联合心理护理干预产

期刊

产科助产心理护理自然分娩

以结果为导向,领导力才不是空谈

期刊

领导力领导者结果导向目标顾客

新形势下加强事业单位文书档案管理工作的思考

作为事业单位各项工作开展进程中的文字载体,文书档案全面记录了事业单位各个工作方面的相关内容,文书档案管理工作的好坏在较大程度上决定着事业单位的发展。随着我国经济转

期刊

事业单位文书档案管理新形势措施

基于遗传算法和神经网络预测的再励学习

提出一种基于遗传算法和神经网络预测法相结合的再励学习方法，利用遗传算法对全局进行最优解搜索，将进化过程中产生的数据用来训练神经网络预测器，当再励学习逼近最优解时，利用预

期刊

再励学习遗传算法神经网络预测矢量控制reinforcement learning Genetic Algorithms（GA） neural netwo

三方综合质押担保产品设计

如今中小企业在国民经济中地位愈来愈高，而资金不足、融资难等现状也越来成为束缚之发展的瓶颈。动产质押融资作为金融和物流业相结合的创新性服务产品，为中小企业的成长建立了

学位

动产质押最低保证金信用风险缓释技术

大规模语料中频繁模式增量发现算法

与本文相关的学术论文