基于Map/Reduce集群上的模式空间划分的数据挖掘

来源 :中国电子商情:通信市场 | 被引量 : 0次 | 上传用户:aihaiyuguijing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过模式空间划分将基于Map/Reduce处理数据集与候选目标模式集的多对多的对应关系的问题转化为处理数据集与各子模式空间的多对多的对应关系问题。大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一Map节点的瓶颈问题。通过多轮的Map/Reduce任务,实现了模式空间的建立、划分,过滤规则的建立、使用,并在此基础上实现了各子模式空间上独立地进行复杂类型模式的数据挖掘。通过充分利用整个模式空间的全局特征及各子模式空间的个性特征,设计了优化的挖掘算法从而提高了挖掘阶段的效率。
其他文献
舌侧正畸技术将托槽巧妙的隐藏在牙齿的舌侧面,满足了成人患者因职业和社交活动的需要而提出的"美观正畸"、"隐形正畸"的要求.与唇侧正畸相比,舌侧正畸同样可获得高质量的矫治效果,临床上使用舌侧矫治器的患者日益增多.为配合医生开展此项技术,提高工作效率,本文具体介绍了临床粘接舌侧矫治器中的护理配合的具体操作方法,分析总结了粘接舌侧矫治器过程中的工作要点及注意事项,取得了较满意的效果。
可逆水印是一种重要的图像数字水印技术,可以通过载体与水印信息的关系实现水印信息的盲提取和原始载体信息的恢复。近些年随着研究的不断深入,出现了很多高效的算法。但针对音
SAT-based bounded model checking (BMC) is introduced as an important complementary technique to OBDD-based symbolic model checking, and is an efficient verificati
本文拟从实证分析的角度对比美国、英国和中国对待该条款的态度,探索该条款发展的历程、存在的目的、具体的含义、适用的条件等问题,并结合中国现有海商法,分析中国在一定条件下
1997年2月22日,英国科学家宣布克隆绵羊成功,这个新闻迅速传遍了世界各地,人们开始了对“克隆人”开展了激烈讨论。随着生殖技术的进步,人们可以进行自我复制,克隆一个与自己一模
本文对我国事实劳动关系法律保护中的不足及立法建议进行了探讨,以期解决事实劳动关系相关的法律问题,保护劳动者的合法权益。
应否开放代孕一直存在很大争议,本文从现有观点谈起,论述代孕合法化的法理基础和现实基础,笔者相信在合理的制度构建下,必能找到一条既能使代孕造福不孕不育夫妻又能避免代孕被滥
学校图书馆是学生接受知识的重要场地.学校图书馆如何组织和策划好适宜学生智力成长的活动,并形成长效机制,不断推陈出新,从各方面满足不同学生的需求,就需要我们每一个图书
集体食物中毒以发病急,病员多为其特点,给急诊抢救工作带来一定的困难,我院急诊科1997年8月30日晚,一次接诊急性食物中毒患者35人,实施了成功的抢救,现报告如下.临床资料1.1
区域经济差异的空间统计对区域发展有重要的作用,在应用阶段,需要综合采用多项经济指标对其进行分析,包括:多指标因子、频率分析和空间自相关分析等,只有对区域经济进行综合性分析