Internet信息获取技术的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:xike68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对Internet上的海量数据进行挖掘,智能地为用户推荐其感兴趣的内容,是近年来国内外的研究热点,日志挖掘是其中应用前景较好的方法。 本文所做的主要工作:①介绍了数据挖掘的定义、基本过程、分类、主要方法和常用技术。②综述了Web挖掘的定义、过程、分类以及三类Web挖掘方法的基本思想和关键技术并将Web挖掘与Web信息检索技术作了比较。③研究了Web日志挖掘中的数据预处理方法以及基于最大前向引用的频繁遍历路径挖掘算法。④初步探讨了使用XML将异构性、半结构化的Web数据表示成结构化数据的方法。 本文的创新之处:尝试设计了一个基于Web日志挖掘的智能Web站点系统模型和其中的预测推荐算法。系统包括4个模块:管理接口、预处理模块、访问模式挖掘模块、智能推荐模块。拟达到的主要功能是:实时监测用户的访问行为,根据从日志中挖掘出的频繁遍历路径,动态地为其推荐匹配度最高的兴趣页面,并预送到用户的缓存中,以节省用户的访问时间和费用,实现既可以智能地获取信息,又能够提高系统性能的目的。整个挖掘、推荐和预送过程对用户透明,通过管理接口可以对系统进行灵活的参数设置和控制,使其具有较好的适应性。
其他文献
论文结合ERP系统的设计与开发,提出用数据库访问代理解决ERP系统发展将要面临的信息安全性和数据库服务器流量控制问题.论文主要研究了数据库访问代理的系统结构、关键技术及
校园行政办公自动化系统是适应学校的要求为实现校内办公自动化而设计开发的。其主要功能是为校内公文流转、人员交流提供一个稳定、高效的办公平台。 虽然OA目前很流行,但
进入当今21世纪“信息高速公路”大发展的信息时代,现代科学技术迅速发展,企业规模日益扩大,越来越多的企业采用计算机及相应的信息技术进行管理和运营,使得企业生成、收集、存储
传统的网络安全产品由于结构设计的原因,普遍存在着管理复杂、互操作困难、功能单一等不足.该文在深入分析安全产品缺陷及其面临的安全威胁的基础上,提出了企业级网络安全连
研究一个信令系统的时候,其重点无非是分析该信令所具备的功能、该信令系统的信令消息、信令程序、系统定时器、编号计划、与其它信令网络的互连等几个方面。 受信令归口组
该文针对传统喷油泵试验台人工控制油缸压力、温度、电机转速等参数的不利情况,结合当前智能化试验台的最新技术,提出了采用MCS-51系列单片机和上位PC机实现对喷油泵试验台全
该文对可视化数据挖掘包含的内容以及重要性进行了阐述,同时提出了一些可视化方法.具体工作如下:1)总结了可视化数据挖掘主要应用的四个方面:数据准备阶段的可视化、模型生成阶
该文在对现有计算机辅助教育进行分析的基础上提出了一种基于Web的教育模型.该模型由教育管理WBEM (WebBasedEducationManagement)、教育测试WBET(WebBasedEducationTest)、
移动客户机位置管理是移动数据库中的一项关键技术,其设计的优劣直接影响了整个系统的效率.论文在分析了现有的各种位置管理方法的优缺点基础上,设计并实现了国产移动数据库M
该文跟踪远程教学的最新动态,利用该实验室现有的技术积累,通过完成远程实验系统的设计与实现,对这种新型的教学方式的系统体系结构进行分析研究并提出新的设计思想,提出网上