论文部分内容阅读
随着Web技术日新月异的发展,人们从网上获取的海量数据开始呈现出全分布式管理、动态和非结构性等特点。如何从庞大的Web信息中为用户提供个性化信息服务已成了人们迫切希望解决的问题之一。研究基于Web的个性化技术和Web用户访问的行为特征,对信息网站的建设和发展具有较大的意义。 另一方面,基于Web的Internet服务已经普及开来,导致Web服务器的安全问题日渐重要。由于各Web服务器认证机制相对独立,使得用户每登录一台Web服务器就必须通过一次身份认证。随着分布式Web工作格局的出现,针对基于多Web服务器环境下的统一认证方法的研究具有重要的意义。 基于Web数据挖掘技术是个性化服务信息处理的关键技术之一。互联网的快速发展使得对Web访问日志分析的需求越来越迫切,Web日志挖掘工作日益受到青睐。本文重点研究了Web日志挖掘,提出了一个Web个性化信息挖掘模型,在进行某高校图书馆个性化服务系统My Library的设计过程中,采用关联规则挖掘算法,从服务器日志中得到用户感兴趣的隐式模式,并将该隐式兴趣集推荐给用户,从而一定程度上实现了个性化服务。该模型中Web日志挖掘研究的难点在于:①如何对原始Web日志数据的预处理;②如何与多数据库表建立关联查询;③如何获取有效的挖掘数据;④如何选择有效的挖掘算法。 同时,本文在分析了现有的密码、认证技术的基础上,通过引入身份鉴别机制和身份映射机制,探讨了安全域间用户身份的传递与转换问题,并对校园网内各Web服务器的信任管理和信任发现中存在的缺陷给出了相应的解决办法;针对新加入的Web服务器,给出了一种改进的单点登录系统(Mending Single Sign-On system,简称MSSO)的设计方案;并根据已有各Web服务器的认证方式的特点,提出并实现了多Web服务器的智能认证代理模型(Intelligent Authentication Proxy Model,简称IAPM)。在该模型下,用户只需登录一次即可完成一个复杂业务。这一方式具有开放性、良好的可扩展性及平台无关性,能方便地集成到已有的局域网系统中。 最后,本文作者在某高校图书馆资助项目——“数字图书馆的个性化服务和一站式登录”的研究开发过程中,以上理论为指导,结合C++、JAVA及ASP.NET技术,实现了本文所提出的My Library和IAPM系统模型。