基于数据挖掘的自适应Web站点的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:bostangul
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球Web站点数量迅猛增长,信息量和复杂度也不断提高。如何合理安排Web站点的内容和组织结构,运用站点自适应技术,建立站点动态模型,进一步增加Web站点的吸引力,提高站点的质量,已经成为Web应用中重要的研究课题。本文重点研究了Web数据挖掘和Web站点自适应技术:分析了事务聚类算法,在聚类的相似性度量上,不再单纯地以访问次数或浏览时间来度量,而是采用用户浏览离散化时间为度量;研究了Web挖掘过程中的聚类和关联规则挖掘,提出了一种基于URL—User ID关联矩阵的用户聚类、页面聚类和频繁路径发现的挖掘方法;设计了基于Web日志挖掘的自适应Web站点系统;从个性化推荐和Web站点优化两个方面入手,分析了自适应站点的实现方法;并利用现有的网络环境,对Web站点优化进行了实验验证,根据试验结果对站点的结构进行了调整。实验证明,改进后的挖掘算法简单高效,资源占用少,挖掘结果真实可信;本文设计的自适应Web站点系统达到了设计目的,具有一定的实用价值。本文仍有不足之处:自适应Web站点的实施包含个性化推荐和Web站点的优化两个方面,本文的实验验证侧重于Web站点的优化,对于个性化推荐着力不够,有待进一步验证;本文实验选取的对象仅是某高校二级学院的Web站点,站点结构相对简单,如何把该系统应用于整个校园网,有待于进一步研究和验证。
其他文献
德国政府于2013年正式提出工业4.0概念。信息物理系统是工业4.0的核心,人们对于信息物理系统的关注度有了很大的提升。智能设备生产工厂是对信息物理系统的一种应用。通过对
在现代社会中,随着科技和经济的飞速发展,人们对身份识别技术的重视程度也进一步提高。传统的身份识别技术,如密码等,由于防伪性比较差,已经不能适应现代社会对身份识别的要
目前,随着计算机网络的高度发展,电脑管理及技术支持的需要,远程操作及控制技术越来越引起人们的关注,人们可以通过简单的终端机完全的控制网络另一端的受控机,从而完成强大
第三代移动通信系统(3G)和无线局域网(WLAN)优势互补的特性推动了WLAN-3G融合组网技术的研究。但是,现阶段国内外的研究工作主要针对采用802.11i安全协议的WLAN与3G网络的融
无线传感器网络是一种全新的信息获取和处理、传输技术,通常包含大量的自组织成多跳无线网络的分布式传感节点。由于无线传感器网络具有组网快捷、灵活,且不受有线网络约束的
第三代移动通信WCDMA(宽带码分多址接入)系统是目前应用最为广泛的通信网络系统,在提供高质量语音业务同时,提供高速率分组数据业务及多媒体业务,为用户提供先进的QoS保证。高效
人脸检测的研究具有十分重要的学术价值,其过程就是给定任意的一幅图像,确定其中是否包括有人脸。 本文首先通过对PAC学习模型的弱学习和强学习进行描述,然后引出经典Adaboos
随着国民经济的飞速发展,一维下料问题在建筑、电力、水利等领域获得了越来越广泛的应用。寻找一种最优的下料方案,不仅可以节省原材料,降低生产成本,而且能够为企业带来直接
本文将MDA过程应用于生成持久层代码。在对多个建模工具的比较研究后,确定使用VP for UML作为PIM的建模工具,对该工具所导出的类模型的XML文件结构做了深入分析,提出了解析该文
随着移动互联网应用的高速发展,安卓智能手机扮演的社会角色变的越来越重要,同时安卓智能手机用户的安全问题也变得越来越严峻。其中,第三方应用程序导致的隐私数据泄露问题