基于频繁偏爱度的使用模式挖掘系统的分析和设计

来源 :江苏大学 | 被引量 : 1次 | 上传用户:lwb3344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,Internet正以惊人的速度在飞速发展,其应用已经渗透到各行各业,越来越多的公司、机构、个人在Internet上发布和查找消息。Internet上不仅充满了文本、音频和视频等多媒体信息,还包括页面间的链接,用户对页面的访问信息等。人们迫切的希望通过数据挖掘技术来发现隐藏在原始信息中的有用知识,然而由于Internet自身的一些特点,很难直接使用数据挖掘技术来发现有用知识。 人们提出将数据挖掘技术和Internet的特点相结合,即通过Web数据挖掘来发现隐藏在海量信息中的有用知识,从而可以改进Web服务器性能、个性化用户访问和商业智能等。 本文首先介绍了Web数据挖掘产生的一些背景知识、Web数据挖掘的概念及其分类等,重点介绍了Web使用信息挖掘的相关知识,并深入分析了挖掘算法一关联规则挖掘算法,从算法的定义、执行步骤、执行效率到最后算法的分析。 接着,提出一个使用信息挖掘的框架。该框架共分为三个模块,分别是数据预处理模块、使用模式挖掘模块、模式分析和可视化模块。在数据预处理模块中,本文提出一种新型的数据源来代替原有的服务器日志,不仅可以很好的记录用户的使用信息,而且处理步骤简单、快速。在使用模式挖掘模块中,本文针对Internet的特点对关联规则算法提出了一些改进措施,使得挖掘出来的模式真正代表了大多数用户的频繁偏爱使用模式。在模式分析和可视化模块中介绍了目前一些常见的方法,重点介绍了OLAP和可视化技术。 最后,介绍了使用模式的一些应用。使用模式被广泛应用在用户个性化访问、改进服务器性能和商业智能等,然而针对目前Internet的安全问题,本文提出将使用信息挖掘应用在用户访问入侵检测中,通过挖掘出来的入侵模式对用户访问进行入侵检测,改善Internet的安全。
其他文献
自从2005年物联网概念在国际电信联盟互联网报告中被正式提出之后,现已越来越多的被运用在人们日常生活中,包括交通、电力、农业、水利、安全、环境和家居等各个方面,然而对
随着我国信息自动化技术的普及,人工超表的方式显得日益落伍,用信息自动化技术进行抄表方式的改造,势在必行。但是我国10KV以下的电力网络,由于其主要分布在城市市区内,不仅地理分布复杂而且数量众多。以往采用的诸如:电力载波通讯、电话网络通讯、RS485、光缆通讯、局部无线通讯等,或多或少存在着一些弊病,如:电话通讯系统速度缓慢;光缆通讯方式造价高、施工困难等。因此在10 KV以下电力网络中,实时数据监
随着信息技术的飞速发展,在计算机支持的协同学习(Computer-SupportedCollaborative Learning,简称CSCL)的研究领域中,协同感知已成为该领域内的一个十分活跃的研究方向。它的目
在大多数的中小企业的生产计划与排产过程中,目前对生产线上的排产工作很大程度上依赖于有经验的老师傅与相关专家人工调整进行,很容易因为疏忽或者是先天的限制产生错误的判断
现今,在嵌入式控制领域里,面对各种设备控制功能需求的不断增长,以往所采用的8位嵌入式处理器已经不能满足需求。随着EDA技术的发展,设计一种面向某一类设备的专用处理器已经成为
SIP协议因其简单、灵活的技术特点,正在逐步代替原有的H.323协议成为IP语音技术(VoIP)的信令核心协议,基于SIP的VoIP终端研究也随之成为一个热点。然而,目前大多数终端的研究
本论文以高校教学管理系统为研究对象,在严格依照软件开发流程开发高校教学管理系统的基础上,对软件开发方法、软件体系结构、关键技术作了较为深入的研究。主要内容为: 第一
访问控制是信息安全保障机制的核心内容,是实现数据保密性和完整性机制的主要手段。 本文首先介绍了访问控制的现状,随之总结自主访问控制和强制访问控制两种传统访问控制
显微镜下的脑脊液(Cerebrospinal Fluid,CSF)图像由各种细胞组成,其拓扑结构复杂多变,采用传统图像分割算法需要对目标进行高精度完整的分割,才能准确的提取到人为事先定义的
随着Web信息的快速增长,搜索引擎已成为用户信息检索的主要工具。元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是它们返回的结果往往数目庞大,并且很多结