基于Map/Reduce集群上的模式空间划分的数据挖掘

来源 :2012(第五届)全国网络与信息安全学术会议 | 被引量 : 0次 | 上传用户:darfehost
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  通过模式空间划分将基于Map/Reduce处理数据集与候选目标模式集的多对多的对应关系的问题转化为处理数据集与各子模式空间的多对多的对应关系问题。大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一Map节点的瓶颈问题。通过多轮的Map/Reduce任务,实现了模式空间的建立、划分,过滤规则的建立、使用,并在此基础上实现了各子模式空间上独立地进行复杂类型模式的数据挖掘。通过充分利用整个模式空间的全局特征及各子模式空间的个性特征,设计了优化的挖掘算法从而提高了挖掘阶段的效率。
其他文献
为了进一步提升全热交换芯体的热交换效率,文章就新风系统全热交换芯体风道结构优化展开了研究,旨在为全热交换芯体新型流道结构的优化设计提供理论基础.结果表明,与原方案相
  考虑了发射段多观测源卫星实时定轨问题,在传统动力学模型方法的基础上,主要研究了一种基于轨道样条函数表示的数学方法,该实时融合方法不必采用动力学模型,提高了运算速度。
19世纪末以后,黑手党已发展为国际性犯罪集团,成为犯罪最多、历时最久的黑社会组织。2009年10月份公布的一份报告显示,意大利黑手党每年的非法收入高达1280亿美元,占意大利国
越有钱越小气!虽然这句话已经得到了很多人的认可,但是,你能想象有着亿万家产的超级富翁,也小气得可怕吗?真的,他们吝啬的程度令人咋舌!    李嘉诚 不能丢失一枚硬币    一次,李嘉诚来到某酒店,服务生为他打开车门,李嘉诚递给他50港币的小费,不小心把一枚硬币掉在地上。这时候,出乎在场所有人的意料,这位拥有130亿美元巨资、亚洲最富有的人快走几步,把硬币捡起来,小心地放回口袋。    特朗普 最爱
1977年9月,23岁的赵世术回到了巫溪县皂角乡.rn他要当大山里的老师.rn在他的记忆中,老师就是救世主.他上了师范学校,在校加入了中国共产党,最后请求就是回大山.rn好不容易找
期刊
目前,原油劣质化问题逐渐暴露,石油化工过程装备的环烷酸腐蚀日趋严重.文章围绕该问题,在环烷酸腐蚀理论基础上,就相关因素对环烷酸的具体影响展开了论述,并就现存的问题提出
生物膜法主要借助生物膜形成过程,充分发挥自身在生态系统中的调节作用.生物膜法的主要工艺有生物接触转盘、淹没式生物反应器、高负荷生物滤池/固体接触工艺和生物滤池等,在
  僵尸网络(Botnet)检测已经成为近年来网络安全领域的研究热点之一,Botnet的一个显著特点是能建立C&C通道,攻击者可以通过这个通道给bots发送命令,并接收与命令相对应的响
殷彩霞,通化市13中学分校9年级班主任、历史教师。她1988年毕业于通化师范学院历史系,至今从教19年,担任班主任15年。自2001年开始担任初中班主任,先在通化市实验中学把生源
  分类标准的制定对于XBRL财务报告的披露起着规范与模板的作用,其质量直接影响着财务报告信息质量。因此,对通用分类标准元素制定情况的评价显得尤为重要。本文研究由我国通