网站可用性分析及可视化技术研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:xiazaikankan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的迅速发展和向社会生活各方面渗透,可利用的信息资源的数量越来越大,人类交互信息也不可避免地电子化和海量化,而巨量、无组织的信息给用户寻找感兴趣的信息增加了困难。Web数据挖掘技术为有效解决这一问题开辟了崭新的途径。本文利用Web挖掘技术对海量的Web访问日志数据进行分析和处理,并将可视化技术应用于挖掘后的结果,使用户更加方便地找到所需信息,从而提高网站可用性。 本文首先分析了国内外的研究状况,着重对日志数据预处理过程及相关方法进行了深入分析和讨论,提出了一种Web日志挖掘数据的预处理算法,可以将用户识别、会话识别和路径补充一次性完成,避免了以往算法分步进行、反复读取庞大日志数据集的不足,从而提高了处理的效率。然后,分析了现有的数据挖掘中的聚类挖掘算法,结合基本蚁群算法理论,提出了一种基于蚁群算法的Web用户浏览路径聚类算法。该算法采用最频繁访问页进行分组,综合考虑了访问时间和访问用户重要程度,结合用户访问顺序、访问网页相同或有相同父节点或子节点进行相似度计算,并在整个聚类过程中,动态调整聚类种类数,得到了较好聚类结果。同时,在聚类基础上进行了路径关联分析。最后,本文还对网站可视化技术进行了一定分析,将Web日志挖掘结果做了可视化处理,使网站管理者直观地发现网站可用性问题。 从实验结果看,本文提出的预处理算法是有效的,改善了实际进行数据挖掘时所要处理的数据的质量,从而使整体算法的效率有所提高。基于蚁群算法的Web用户浏览路径聚类算法也能更加准确地得到用户的浏览情况。在此基础上利用蚁群算法的转移概率分析关联网页进行个性化推荐,覆盖率和准确率较采用Apriori算法高,能更准确地反映用户浏览趋势。同时,网站管理者可以参照用户浏览情况可视化的分析结果调整网站结构,从而达到提高网站可用性的目的。
其他文献
基于Linux国际化和标准化的开发实践,本文对系统软件国际化的总体结构和Linux国际化的一些关键问题进行研究,取得5个方面的主要成果: 第一,归纳了软件国际化需求,以服务分类的
自1991年由Mitchell和Papadimitriou提出带权区域问题以来,人们开始认识到带权值模型的通用性较强,陆续有很多学者开始研究这个问题。在二维带权区域近似最优路径问题中,一个二
With the rapid development of network and multimedia technology in recent years, information hiding has been a research hotspot in the area of information secur
自动模式匹配问题是数据集成、数据仓库、电子商务和P2P等很多领域重要的研究基础。本文对自动模式匹配研究领域存在的几个关键问题进行了研究,取得了以下五个方面的主要成果:
地学(空间)数据模型的研究能为地质科学数据的共同理解提供基础。在已有数据模型或建模中,由于侧重于项目需求的建模,加上受于个人数据库技术的限制,使领域内的数据建模在数
本文提出了基于图像特征的视频检索方法,是从视频图像特征的角度构建语义特征,进行视频数据的分割,实现基于内容的视频检索功能。本文对基于内容的视频检索关键技术进行了综述,提
本文的选题来源于国家教育部“中国大学数字博物馆共享平台与规范标准研究”项目之“地学类数字博物馆”项目。 数字博物馆是博物馆的发展方向之一。随着信息技术的发展,用
互联网用户数量的快速增长,为互联网服务的发展带来了新的机遇,也带来了新的挑战。一些服务中的用户推荐功能及定向广告等均依赖于对用户地理位置的了解,确定用户的地理位置
无线传感器网络是由部署在物理空间内的大量廉价微型的传感器节点通过无线通信技术自组织构成的网络系统,可实现特殊环境下的数据的采集、处理和传输功能。无线传感器网络是当
坦克动力舱协同布局设计是一个复杂的过程,它涉及到了多方面的技术应用。近几年来,坦克设计工具、设计方法等方面的发展给坦克设计领域带来了新的问题和挑战。如何改善各种设计