海量文本数据库中的高效并行频繁项集挖掘方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户：whf19

【摘要】

：

针对大规模文本数据库中频繁项集挖掘的特殊要求，本文提出了一种新的并行挖掘算法parFIM。parFIM以一种简单的数据结构H-Struct为基础，对数据进行纵向划分从而实现并行挖掘。算

【作者】

：

王永恒杨树强贾焰

【机构】

：

国防科技大学计算机学院

【出处】

：

计算机工程与科学

【发表日期】

：

2007年9期

【关键词】

：

文本挖掘海量文本数据库频繁项集并行 text mining very large text databasefrequent itemset paral

【基金项目】

：

国家863计划资助项目（2004AA112020,2003AA115210,2003AA111020）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对大规模文本数据库中频繁项集挖掘的特殊要求，本文提出了一种新的并行挖掘算法parFIM。parFIM以一种简单的数据结构H-Struct为基础，对数据进行纵向划分从而实现并行挖掘。算法同时考虑了去除短模式和减少重复模式。实验结果表明，parFIM能够很好地适用于大规模文本数据库中的频繁项集挖掘任务。

其他文献

Solidworks 2003在机械设计方面的应用

文章详细分析了Solidworks 2003的技术特点,介绍了其在机械设计方面的应用.

期刊

模块相关性模具

基于粗糙集和模糊集的属性约简算法

粗糙集理论和模糊集理论都是用来处理不完整和不确定信息的理论,两者都可用来观察、测试数据并进行推理.虽然它们之间有一些重叠,但两者的着眼点和计算方法是不一样的,因此不

期刊

数据库系统数据挖掘粗糙集理论模糊集属性约简算法rough set theory fuzzy set theory reduction algorith

“一带一路”研究文献中中国文化走出去传播作用研究

2013年9月,习近平总书记提出"一带一路"倡议,深刻阐述"五通"战略思想。其中"民心相通"重点阐述了文化的交融与融合。随着倡议的不断深入,"一带一路"相关文献研究数量也在逐年

期刊

“一带一路”文献中国文化走出去传播作用

简述振冲碎石桩复合地基施工的监理质量控制

随着我国建筑业的蓬勃发展，各类高层建筑在全国大量兴建。我国幅员辽阔，有着各式各样的地质条件。万丈高楼从地起，高层建筑的基础都有一定的埋深，而地基承载力更是整栋建筑物或构

期刊

振冲碎石桩施工监理质量

某新月拱桥抗震性能研究

新月拱桥是中承式钢管混凝土异型拱桥,位于8级地震区.首先采用有限元软件Midas/Civil建立全桥模型,通过其自振特性分析该拱桥动力特性；然后采用反应谱法和动态时程分析法进行

期刊

钢管混凝土拱桥抗震分析反应谱法时程分析

时间域VSP资料的波场分离

在非零偏移距ＶＳＰ三分量资料中，由于炮点到检波点的入射角较大，垂直分量和水平分量检波器可同时接收到Ｐ波和Ｓ波。入射角的变化又使得分量检波器接收的Ｐ波和Ｓ波能量存在明显的变化。

期刊

垂直地震剖面时间域波场分离VSP地震勘探

某电站大坝变形监测结果初步分析

以原型观测为基础,将理论分析与实际监测结果相结合,对某电站大坝蓄水期变形规律进行了分析和评价。结果表明:水平和垂直位移变化过程线变化规律基本一致,大坝蓄水初期水位的

期刊

水电站大坝变形监测水平位移垂直位移

网上阅卷带来的欣喜和警醒

网上阅卷是以光电高速扫描技术和计算机网络技术为依托,实现客观题自动阅卷,主观题网上评阅。网上阅卷让学校教师欣喜地感受到科技带来的革新。网上阅卷随机分发,随机抽取,并

期刊

网上阅卷计算机网络技术统计分析工作随机抽取扫描技术自动阅卷学生信息数据处理

基于USB的12导联同步心电采集系统

提出了基于USB芯片FT245BM、高速四通道12位同步A/D转换芯片AD7864和64管脚8位单片机AT89C51ED2的十二导联同步心电采集系统.此系统以15kHz,采样率同步采集和记录12导联同一

期刊

通用串行总线(USB)十二导联心电图同步采集USB 12-lead ECG (electrocardiogram) Synchronous samplin

某钢筋混凝土框架结构地震响应弹塑性时程分析

文章基于合理的杆系结构数值分析模型，针对一个采用减震控制技术的实际钢筋混凝土框架结构进行了罕遇地震下的弹塑性时程分析。利用有限元分析软件强大的计算能力和后处理功能

期刊

弹塑性时程分析钢筋混凝土框架结构粘滞流体阻尼器

海量文本数据库中的高效并行频繁项集挖掘方法

与本文相关的学术论文