基于分布式集群的网络浏览行为大数据分析平台构建

来源 :中国电子科学研究院学报 | 被引量 : 0次 | 上传用户:zero_alan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统基于在线学习的网络浏览行为数据分析平台,缺乏大数据分析能力,无法挖掘和管理用户网络浏览行为,分析效率较低,具有一定的局限性。构建基于分布式集群的网络浏览行为大数据分析平台,平台总体结构由视图层、控制层、服务层、数据持久化层和数据层构成,使用分布式存储系统HDFS与分布式计算系统Spark组成的分布式集群存储和管理网络浏览行为产生的数据,通过数据上传流程将海量网络浏览数据源存储到分布式存储系统HDFS中,在Spark分布集群内运算数据挖掘任务,利用决策树ID3算法准确挖掘网络浏览行为。实验结果说明,所设
其他文献
本文为AGV无人叉车在印刷行业的应用,无人叉车AGV与印刷现场的WMS、印刷机、拆盘机、立体库进行智能对接输送托盘物料,共包括5条工艺运行线路。系统按照车间布局、工艺流程需
青年奥林匹克运动会是国际奥委会创立的一项新的全球性综合体育赛事。作为奥林匹克运动中的一项新事物,其承载着巨大的历史使命。青奥会把焦点对准全球青年,旨在对全世界的青
随着信息技术革命的到来,传统的管理方式也发生了变化,迎来了知识管理的时代,将知识作为管理的一个主要目标,思考知识管理相对传统管理方式在观念和体制上的变化,这将有助于
目的探讨白藜芦醇对K562细胞的凋亡诱导效应和可能的作用机制.方法应用噻唑蓝(MTT)比色法、Wright-Giemsa染色、DNA琼脂糖凝胶电泳和细胞周期分析法检测K562细胞凋亡;采用流
会展经济作为一种新的经济形式,是现代市场经济和新经济发展的必然产物。我国的会展经济起步晚,发展快,在发展过程中还面临许多问题。妥善解决这些问题,有利于推进我国会展经
贵阳有着丰富的旅游资源,但由于资金,技术和人才上的制约,目前开发程度较低,如何将潜在的资源优势转化为现实的经济优势,进一步推动地区经济的发展,是贵阳旅游业发展的目标。
为探讨纤维素对假交替单胞菌属细菌等在生物被膜形成过程中的生物量和胞外产物的影响,以及生物被膜等生物学特性的改变对海洋无脊椎动物幼虫附着变态的影响,选取对厚壳贻贝My
目的通过研究人肾癌组织和癌旁正常组织中差异表达的基因,寻找肾癌相关基因以用于诊断和治疗.方法以包含8 000个cDNA基因表达谱芯片研究1组肾癌组织样本的基因表达谱.按一步
文章对知识经济理论及测度理论做出回顾性的梳理,对现有理论在对知识经济进行测度时存在的问题进行分析和评价,以使人们对此有更深的认识和了解。
城市服务营销策略的制定,依据城市环境分析、制定目标和细分市场、制定总体营销策略三大步骤完成。但在传统形势下,按照已制定的城市服务营销策略规划城市,对环境生态的发展