蚁群算法在Web日志挖掘中的研究与应用

被引量 : 0次 | 上传用户:catloveless
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web站点自身信息越来越丰富和拓扑结构越来越复杂,目前信息服务中普遍存在着“信息过载”和“资源迷向”的状况。从用户的角度,不同的用户有不同的访问目的,而同一个用户在不同时期的访问兴趣也可能会发生变化。对网站来说,只有迅速满足用户的访问需求,提高信息服务质量,才能创造更大的经济效益。为了解决来自用户和网站双方面的问题,自适应网站应运而生,它通过学习用户访问模式,呈现不同的界面给不同的用户并且完善网站自身拓扑结构。蚁群算法是一种新颖的求解复杂组合优化问题的模拟进化算法,它具有典型的群体智能的特性。由于其在求解复杂优化问题方面的优势,在很多领域都得到了应用。因此,把蚁群算法应用于Web日志挖掘,实现网站自适应,即把从日志数据中提取的知识转换成站点的智能,使其为用户提供更高效的服务。准确及时的掌握用户对网站的访问情况是确保网站高效地实现自适应性的重要依据。本文主要研究如何利用Web日志挖掘技术分析Web日志以获得这些信息,并基于蚂蚁的群体智能行为提出相应的Web挖掘算法来研究网站自适应,使其能为用户提供自适应的个性化推荐。为此,本文主要做了以下几个方面的研究工作:(1)为了从Web日志文件内容向各种挖掘算法提供准确的数据源,对Web日志挖掘预处理工作中的问题进行了讨论。(2)分析蚂蚁觅食行为与用户浏览网页行为的相似性,基于自适应网站技术,提出了一种实现网站自适应的算法----AAWA算法。(3)受蚂蚁能识别与之相遇蚂蚁是敌是友行为的启发,提出了一种蚂蚁聚类算法----ACRSA算法,并应用该聚类算法对用户事务模式进行聚类,从而在推荐系统中进行相似兴趣用户聚类推荐。(4)为了提高Web日志预处理质量,及在个性化推荐过程中为用户推荐更适合的页面,讨论了提取网站拓扑结构信息的技术。并结合站点拓扑结构对上述的两种算法进行了相应的改进。(5)设计并实现了一个自适应网站的原型系统,从而验证了运用相关技术实现网站自适应是可行的。本文应用Web日志挖掘技术从Web服务器日志中提取用户访问模式,将挖掘到的知识转变为站点的智能,实现站点自适应。对Web日志挖掘应用的一个方面----自适应网站的研究,有利于提高站点信息服务质量,促进智能信息处理领域的发
其他文献
20世纪40年代,经历了两次战乱的艺术家将战地的硝烟与精神创伤表现在艺术作品中,诞生了许多杰出的艺术流派,电影也不例外。文章以不同流派相同题材的两部电影《沉沦》和《邮
志愿服务几乎是每个文明社会不可或缺的一部分,它是文明社会的重要标志。青年大学生是我国志愿服务的生力军和重要参与者,为了更好地推动社会文明进步、推动公益事业的发展、
本论文完成了一个基于反射型红外线传感器的CMOS模拟专用集成电路的设计,它构成的红外系统具有探测心跳频率的功能。设计根据人体组织的半透明度会随心脏跳动而变化的特点,由
上世纪80年代中国内地全面改革开放,各种新思潮不断涌入,影视生活成为当时中国社会景观的一个重要侧面,丰富着人们的生活,影响着人们的着装,服饰文化的传统意识被赋予了新的
电能需求的增加和环保要求的压力促进了新能源的发展。风电是无需燃料费用的可再生绿色能源,由于其利用成本的低廉和技术的成熟,风电已成为可再生能源中发展最快的、最具有发展
素质教育和新课程改革的开展实施,创新思维的教育逐渐受到重视。基于吉尔福特关于创新思维的核心是发散思维的观点,培养发散思维成为培养创新思维的突破口。由于传统的封闭题不
《全日制义务教育语文课程标准》提出:“口语交际能力是现代公民的必备能力,应培养学生倾听、表达和应对的能力,初步学会文明地进行人际沟通和社会交往,发展合作精神,使学生具有文
以吉林省四平市为例,选取社会、经济、人口、土地等多个城市化发展相关指标,采用层次分析法构建城市化综合水平测定模型,分析比较四平市城市化综合水平与经济发展水平及吉林
近年来,随着绿色食品的开发,天然绿色植物的研究摆上了日程。笃斯越桔和越桔的营养保建和医疗作用逐渐被人们所认识。黑龙江省大小兴安岭在我国具有独厚的条件,不仅资源丰富,而且
经过近一个世纪的研究发展,最优化理论及相关算法都日臻成熟。传统的优化算法具备理论完备、算法效率较高、结果稳定性较好等诸多优点,因而在实际的工业过程中获得了广泛应用。