并行数据挖掘平台中算法推荐方法的研究与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:zhustrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘技术的成熟与发展,数据挖掘算法的数量与日剧增。不同的数据挖掘算法适应不同的任务场景和用户数据,能否正确地选择出合适的挖掘算法直接影响到数据挖掘工作的效率和质量。数据挖掘技术的复杂性和专业性要求用户必须具备非常全面的专业知识才能正确的使用和选择已有的数据挖掘算法,这对于普通用户而言是非常困难的。因此,如何将数据挖掘算法的选择过程自动化已经成为目.前数据挖掘研究领域中亟待解决的问题。本文提出了一种以用户的挖掘任务和数据特性为依据的数据挖掘算法智能推荐模型。该模型建立在已有的并行数据挖掘平台上,从用户数据的特性入手,结合数据挖掘算法的性能知识和大量的实验,自适应地构造出数据挖掘算法性能知识库。基于算法在特性相似的数据上表现出的性能也相近的原理,通过比较用户数据与性能知识库中已有数据的相似性,自动地为用户选择最合适的数据挖掘算法,极大地方便了用户对该并行数据挖掘平台的使用。本文对算法推荐模型的设计与实现借助于并行数据挖掘平台提供的操作界面、数据挖掘算法等资源,通过计算数据的特性参数实现对用户数据的特征提取,通过计算数据的特征矢量距离实现数据相似性的比较,通过定义算法性能知识库的组成、结构及操作实现算法性能知识库的构建与维护,通过计算准确率、凝聚度等性能指标实现对算法性能的评估与比较。算法推荐系统的设计与实现工作结束后,本文还设计了大量的实验,对推荐算法和普通算法的挖掘性能进行对比与分析,验证了推荐结果的正确性。
其他文献
期刊
字典中对“生成”的一种解释是:自然形成,生就.我以为,这就是知识形成的本质,数学知识理所应该是自然形成的,数学教学也理所应该是自然生成的,学生自然生成知识与技能,生成过
基于天津地铁既有车站结构改造工程,对大型地铁车站地下结构的改造方案进行研究。提出沿车站长度方向隔跨跳仓改造、沿深度方向自上而下分层改造的方案。在地下车站结构改造
从西方资本主义国家的发展历程来看,大力发展证券市场可以优化资源配置,为经济发展提供资金支持,为公众提供财富增值的渠道,从而促进整个国民经济又好又快的发展和人民生活水平的
虽然均以叙述为主要构成成分,但是叙事诗体与说唱体在诸多方面存在差异:前者情节设置不求故事完整,人物刻画不是核心,叙述视角灵活多样,心理描写细腻,情感表达直陈评论;后者
背景及目的鼻塞是严重影响病人鼻功能以及生活质量的常见问题,下鼻甲手术是改善鼻塞最常用的手术之一。以往下鼻甲手术常采用部分切除、减容(冷冻、激光、消融等)等手术方式,
<正>大面积烧伤的病程长,病情变化多,在整个治疗过程中护理工作占有比较重要的地位。在护理工作中,我们既不能认为大面积烧伤的护理一定要具有整套的设备条件才能进行,也不能认为
《语文课程标准》强调:“让学生能不拘形式地写下见闻、感受和想象,注意表现自己觉得新奇有趣的或印象最深、最受感动的内容”,叶圣陶也曾说过:“我们最当白戒的就是沦没在虚空之
中学体操是浙江省体育与健康课程指导纲要中的必修教学内容.体操教学有利于培养学生身体姿态美,发展学生的基本活动能力,提高学生身体的感知能力,有利于传承运动文化.省指导
主持人语本栏目主要探讨美学的流变与审美的文言化。希腊语aisthetikos意指感受。德国哲学家鲍姆嘉通1750年出版的Aesthetik一书,"是以美的方式去思维的艺术,是美的艺术理论,"