基于Hadoop的数据挖掘算法在葡萄酒信息数据分析系统中的应用

来源 :计算机应用 | 被引量 : 0次 | 上传用户:lx2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对宁夏贺兰山东麓葡萄酒庄在销售自产葡萄酒的过程中存在葡萄酒信息数据分析不准确、销售渠道窄、销售信息更新慢、销量不高等问题,提出了一种基于Hadoop分布式框架的数据挖掘算法,对极大量的葡萄酒信息数据分析系统的数据进行采集、分析,并根据分析结果为用户推荐适合其口味的葡萄酒饮品。该系统以宁夏贺兰山东麓葡萄酒庄为实验基地,自主开发葡萄酒信息数据分析系统,并利用数据挖据算法中的聚类算法K-means算法和分类算法中的C4.5算法进行数据挖据;其中针对聚类算法中的K-means算法和分类算法中的C4.5算法实现分布式研究,实现了基于Map Reduce的分布式聚类和分类算法,并且在此基础上对其各自的缺点进行相应的改进。实验证明了基于Hadoop框架的数据挖掘算法在算法的稳定性和准确率上均有很好的提升,并且可以对葡萄酒信息数据分析系统的海量数据进行很好的处理。
其他文献
国家利益的分析与实现唐永胜,刘静波,张志忠编者按国家利益专题研究本刊已陆续刊发三篇文章,阎学通先生“国家利益的判断”意在引发人们对国家利益问题研究的重视,面对多变的国际
经济危机中的大量农民工返乡给重庆这个年轻的直辖市带来了新一轮的就业压力,而企业不可能完全解决返乡农民工的就业,因此有序地引导一部分有条件的返乡农民工自主创业迫在眉
<正>背景介绍一天,我从教具室借了几个陀螺放在班级科学区,立刻引起了小朋友的注意。政圣小朋友问:"丁老师,这是什么呀?"奕纬小朋友说:"这是陀螺,我家也有一个。""要怎么玩?"
作为一种新的认识论视角和理论分析方法,奠基于事物为本哲学的行动者理论在过去30年间被广泛应用于社会科学领域。由于学前儿童的心理发展特性,行动者理论的视角对于学前教育
通过对291名企业在职员工进行问卷调查,构建结构方程模型,采用层级回归分析法,探究工作压力、企业文化对员工偏离行为的影响以及不同类型企业文化对工作压力与员工偏离行为关
在物质极大丰富的今天,人民对精神文化生活的需求也越来越高,这对于文化产业的发展来说就提出了更高的要求和挑战。其中,作为文化产业的代表影视传媒行业的发展越来越成为人
高等学校的学科建设,在注重学科自身发展特征的同时,既要体现出各学校自身特色、优势,表现出一定的稳定性、历史性,符合各自学科知识体系所要求的内在客观规律,又要不断进行
<正>在科学技术突飞猛进,经济竞争日趋激烈,人类社会快步走向信息时代的今天,公文在为党政机关、人民团体和企事业单位实施领导、处理公务、沟通信息、联系事务、传达贯彻党
<正>近年来,国际上微纳卫星技术发展迅速,多家企业和研究机构推出了各种高性能微纳卫星计划,特别是在商业遥感领域如天空盒子成像公司(Skybox Imaging)的"天空卫星"(Sky Sat)
天地一体化信息网络是网络和空间技术快速发展的必然产物,也将是国家重要基础设施。卫星导航系统的空间星座构型完美,而且新一代卫星导航系统将具备星间信息传输功能,称为星