【摘 要】
:
如今的互联网发展迅猛,互联网企业也面临极大挑战,每天会被数以万计甚至百万千万的用户访问。为了提供更好的服务质量,了解用户的访问特点及用户需求,迫切需要对用户的访问行
论文部分内容阅读
如今的互联网发展迅猛,互联网企业也面临极大挑战,每天会被数以万计甚至百万千万的用户访问。为了提供更好的服务质量,了解用户的访问特点及用户需求,迫切需要对用户的访问行为进行分析研究。根据研究出来的用户行为规律来改进网站,吸引更多用户的眼球,从而给客户带来更好的体验,同时给公司带来商机。Web日志分析便因此而产生。所谓的Web日志分析,就是收集用户访问网页时产生的所有日志信息,进而对这些日志进行数据转化、清洗、挖掘的-个过程。互联网企业的壮大以及应用系统规模的扩充,相应日志信息的数量级也在同步增长。传统的单机版日志分析系统完全不能达到目前互联网企业日志分析的需求,为此,大规模数据处理平台就成为日志分析的理想平台。本文主要研究Hadoop分布式计算框架和MongoDB分布式数据库,并基于Hadoop和MongoDB设计高效的Web日志分析方案。在Hadoop和MongoDB中基于MapReduce进行算法设计时,本文提出了映射(mapping)表文档优化方案,以提高日志分析的效率。在日志分析算法设计中本文提出了局部合并键值算法,降低写入和传输的数据量,提高了算法效率。在客户端设计中,本文主要介绍基于SliverLight客户端应用程序的框架设计和构建,以便高效开发客户端的具体应用模块。
其他文献
文化产业决定了一个国家的软实力,互联网与文化产业融合发展可以实现我国文化产业跨越式发展。2016年1月30日,湖南省第十二届人民代表大会第五次会议批准了《湖南省国民经济
芜湖市白蚁种类有二科五属十七种,危害较为广泛,不仅侵害旧区的老房屋,还危害钢筋混凝土结构的各类房屋建筑,同时,白蚁还对园林、江河干堤有危害。白蚁危害日趋严重的原因主要是芜
市政工程中的排水管道工程对城市人民生活产生着重要的影响,要提高市政排水管道工程的质量,就要在施工过程中加强管理,采取合理的施工技术和方法,努力克服各种质量通病,才能最终确
经国家新闻出版广电总局批准,《轻音乐》更名为《当代音乐》。更名后的《当代音乐》分上旬版与下旬版两种,均为大16开本,每期各9印张144页。《当代音乐》下旬版设有:艺术歌曲(五线
免征农业税是新农村建设的重要举措,不仅减轻了农民负担,更将引发农村上层建筑和农村经济社会各领域的深刻变化。但是,我们应免征农业税也产生了诸多亟待解决的问题,必须继续深化
目的探讨温灸治疗对促进经皮肾镜碎石术后患者胃肠排气功能的疗效。方法将44例在硬腰联合/全麻下经皮肾镜碎石术治疗患者按就诊先后顺序分为温灸治疗组和常规护理组,比较两组
2013年被称为中国碳交易元年。截至2013年12月,已有北京、天津、上海、广东和深圳五个省市先后启动了地方碳交易试点并产生了地方配额交易和价格。预计2014年一季度,湖北和重
我国配电网多数为小电流接地系统,其单相接地故障定位问题长期以来没有得到很好解决。本文按照先定位故障区段后定位故障点的思路,通过分析配电网不同接地方式下发生单相接地
创业教育是涉及到经济学、管理学、社会学、心理学等在内的综合性学科,但我国对创业学的研究刚刚起步,学科建设中创业课程几乎是空白,表现在课堂上的创业课程是零碎的,教材建设亟