论文部分内容阅读
随着网络技术的巨大发展以及互联网使用者的不断增加,互联网已经成为主流的信息发布媒介之一。如何快速、准确地在网络中找到所需信息,并且以更加人性化的方式为用户提供服务成为了网络技术研究的热点。本文采用信息聚合技术设计并实现了一个网站个性信息的定制服务系统。RSS (Real Simple Syndication)技术是近几年发展起来的在互联网上被广泛采用的内容包装和投递协议,各种类别的信息通过RSS发送,被广泛应用于博客、新闻信息、个性化搜索、电子商务等各个领域。论文首先介绍了RSS的起源、定义、标准和工作原理等相关知识,然后对系统的概念模型、模块设计和体系结构进行了详细阐述。在系统体系结构部分,本论文采用了DMVC的设计模型。整个系统的数据包括用户数据、RSS频道数据等,这些数据由java bean进行了封装。系统的页面由FrontPage 2003结合JSP代码实现。整个系统的模型有3个:HtmlInformationExtractor、RssInformationParsor和DBBean。HtmlInformation-Extractor实现从html页面中抽取了相关信息,并生成了rss文档的功能;RssInformationParsor实现了RSS文件的解析,并以html格式存入了数据库;DBBean则实现了相关的数据库操作。系统的控制由ControllerServelet类完成,其实现了各个页面的跳转。相比较于RSS Feed的手动分析提取,本文提出的自动抽取方法不仅可以方便地实现HTML格式向RSS的转换,而且可以自动下载网络上的RSS Feed,实时地更新RSS数据库。同时,本文还建立了RSS Feed分类管理的机制,使得网站个性服务能够容纳多个不同方面的RSS Feed,并将不同的RSS Feed聚合在相应的分类之下。总的说来,该基于RSS的网站个性信息定制服务系统可以满足用户对信息的个性化需求,并且RSS Feed的自动分析提取可以方便用户对信息的获取。