基于Web使用挖掘技术的应用研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:umum78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的迅速发展,以及网络在社会生活中的广泛使用,使得网络上的信息资源越来越多,人类交互信息已不可避免地海量化,而巨量、无组织的信息给用户寻找感兴趣的信息增加了困难。面对巨大的网络信息,如何发现用户所需信息?为了解决这个难题,Web挖掘技术应运而生。Web使用挖掘是Web数据挖掘研究领域中一个重要方面,它是通过挖掘Web服务器日志记录以发现用户访问Web页面的模式,挖掘有用模式和预测用户浏览行为的技术。 本文对Web使用挖掘进行了系统、全面地归纳与分析。并在分析和总结国内外相关资料的基础上,深入研究了Web使用挖掘的二个阶段: (1)通过对Web使用挖掘的数据预处理过程的研究,提出了结合网页内容与网站结构进行预处理的方法。具体实现过程是利用IP+Agent+参考页面+网站拓朴结构识别用户,然后利用用户访问的网页内容进行事务处理。利用这种方法对数据预处理后,结果具有较高的精确性。 (2)采用蚁群混合聚类算法进行用户聚类分析。即利用蚁群聚类算法进行初始聚类获得初始聚类中心,然后用K-均值聚类算法改进聚类的结果。在利用蚁群混合聚类算法实现用户聚类算法中,考虑到用户访问行为以及内容对用户兴趣的影响,改进了蚁群混合聚类算法的相似性计算公式。改进后的算法充分结合了两种聚类算法的优点,解决了传统聚类算法所面临的一些问题,能产生比较理想的聚类结果,从而提高了聚类质量。
其他文献
蓝牙(Bluetooth)是一种短距离无线通信技术,利用蓝牙可以有效地简化移动设备之间的通信。作为一项新兴的技术,蓝牙以其强有力的技术背景和良好的市场预期,逐渐被业界所接受。
P2P技术,也称对等网络(Peer to Peer)技术,它与客户端/服务器(Client/Server)结构(也就是WWW所采用的结构方式)的一个本质区别是:整个网络结构中不存在中心节点(或中心服务器)。在
随着电网建设的发展,继电保护信号对通道的要求日益提高。目前电力光纤网络受到继保通信行业广泛关注,它依附于电力线路走廊,安全可靠,不受电磁干扰,成为继保通道的首选方案。但利
近年来,包括智能手机和平板电脑在内的移动智能终端发展迅猛,尤其是其在移动通信和多媒体处理上的能力均得到了极大的提升。这些设备均配备有高清摄像头、触摸屏及高性能的处
计算机系统已在国防、通讯、金融、能源、交通、医疗等关键领域中得到广泛应用,构建高可信系统已成为世界范围的重要课题。其中操作系统内核的安全可靠性是构建高可信计算机
随着城市规模的扩大和提倡建立节约型社会的需要,公共交通逐渐成为人们出行的主要手段。如何能够详细及时地提供公交信息,为广大乘客提供出行决策,是非常有必要研究的内容。
TTCN-3是被ETSI和ITU-T标准化的新一代协议和软件测试语言,有着广泛的应用前景。为了执行这种语言,需要设计专用的编译器或解释器,以及相关的测试平台。通过研究分布式测试系统
视觉诱发电位(VEP)是大脑皮层对视觉刺激发生反应的一簇电信号电位。从临床诊断的角度来看,通过VEP的少次提取,可反映出受检者视觉通路的完整性,在神经生理学研究以及临床诊
模糊限制语具有不确定性的含义,常用于缓和说话人的语气或减轻说话人对所陈述命题应付的责任。由模糊限制语引导的信息是不确定的信息,在信息抽取时,应将事实信息与模糊限制
软件质量度量是提高软件质量的一个重要途径,本文在分析CMM和软件过程的基础上,将CMM中不断改进的思想纳入到软件质量度量过程中,对软件质量度量模型和度量工具进行了研究。本文