【摘 要】
:
针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的
论文部分内容阅读
针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的Web日志挖掘算法。为进一步验证该算法的高效性,通过搭建Hadoop--?-台,利用该算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,充分利用了集群系统的分布式计算能力处理大量的Web日志文件,可以大大地提高Web数据挖掘的效率。
其他文献
9月13日,甘肃省金昌市消防部门联合金昌市特殊教育学校,成立了一支由手语教师组成的特殊志愿者队伍,为听力障碍人士开展消防安全教育。据了解,金昌市约有5000名听力障碍人士,为了
【正】 一九八○年十一月二十八日,河南襄城县范湖公社尧城宋大队社员代衣丰,在该大队盛庄村西起土积肥时,发现古代铜乐器一件,经县文化馆脱锈鉴定,认为是新莽时期所铸铜钲。
高校农村职业技术教育专业.是为农付职业中学培养农业技术专业课教师。但由于世俗的偏见和办学条件差的原因.导致农职教专业学生在校期间思想波动.为了做好这部分学生的思想
本文以西藏大学地球科学与资源环境学系的三门专业课程为例,将学术报告作为一种创新教学环节引入课程,通过问卷调查及数据分析,认为学术报告形式在教学互动性、内容丰富性、效果
利用偏微分方程的方法研究了Merton利率模型下的欧式期权定价问题。得到了此模型下欧式看涨期权所满足的Black-Scholes方程,并给出了欧式看涨期权的定价公式。在文章的最后给
巴南区位于长江之南,是重庆市主城九区之一和都市经济发达圈的重要组成部分。进入新世纪后,我们坚持以邓小平理论和“三个代表”重要思想为指导,紧紧抓住发展这一执政兴国的第一
<正>爆发性1型糖尿病(fulminant type 1 diabetes,FID)是近年由日本学者Imagawa等首先提出的1型糖尿病的新亚型[1]。该病起病急,进展快,病情危重,预后凶险,其发病机制和临床
提起庄奴,人们并不陌生,由他作词的<甜蜜蜜>、<小城故事>、<小村之恋>、<又见炊烟>、<海韵>、<冬天里的一把火>等经典情歌,唱红了邓丽君、费翔等许多著名歌星.但很多人不知道
本文从通信技术和计算机技术的内涵出发,就融合技术的有效性进行了分析,并对通信技术和计算机技术融合发展的趋势进行了讨论,希望能够为技术的发展提供参考。
本文基于5G网络超密集组网建设构架与技术进行研究和实践,仅供后续5G网络的应用和发展参考。超密集组网将满足5G网络流量以及用户体验需求的主要技术之一,为此,基于5G网络的应急通信,开展了超密集组网技术实践与研究,通过缩小站间距离、合理应用资源、多样的无线接入和传输方式、各类型基站等组成超密集组网架构。