论文部分内容阅读
随着互联网的日益普及,各种各样的网站如雨后春笋般大量涌现,海量的信息充斥在人们眼前,给人们提供着方便而快捷的服务,在一定程度上改变了人们生活工作的方式。但同时,大量的垃圾信息也影响着人们的使用效率。在这种情况下,对网站进行科学、合理的评估就显得尤为重要。网站评估不但能够很好地指导用户使用,同时,还可以促进网站的发展,指导网站如何提高自身质量。 把导致问题的原因归结为技术和内容两个方面。技术方面是指网页布局和网站结构、链接等方面的可用性,在评价技术上通过对网站结构的测试或结构的可视化表示、访问日志的分析等获取相关信息加以评判;内容方面是指根据构建该Web的目的,是从语义上对内容的组织,体现在网页主题逻辑和网页内容的相互关联等方面上。因内容体现了设计者的主观性,目前在Web的评价上往往只能通过用户实际操作,根据个人判断加以评判,很难实现自动化的评价分析。 针对这种情况,提出一种基于本体的WEB站点语义结构评价模型,该模型主要包括三大部分:网页处理、站点语义结构分析、评价体系结构,其中网页处理又包括站点拓扑结构获取、页面结构分析和网页分类,主要用于获取站点的网页主题概念和链路关系;站点语义结构分析中本文提出了一种语义结构的生成算法,该算法依据领域本体的概念关系,将之前获取的网页主题概念和链路关系按照一定的规则重新组织成站点的语义结构,并且挖掘其中的含义,用于后续的自动评价部分;评价体系结构是针对站点内容信息和结构方面提出的一套评价指标,依据这些指标,采用混合评价方法对站点进行半自动化评价,最后给出一个评价结论。