WEB站点语义结构评价系统研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:hesur
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的日益普及,各种各样的网站如雨后春笋般大量涌现,海量的信息充斥在人们眼前,给人们提供着方便而快捷的服务,在一定程度上改变了人们生活工作的方式。但同时,大量的垃圾信息也影响着人们的使用效率。在这种情况下,对网站进行科学、合理的评估就显得尤为重要。网站评估不但能够很好地指导用户使用,同时,还可以促进网站的发展,指导网站如何提高自身质量。  把导致问题的原因归结为技术和内容两个方面。技术方面是指网页布局和网站结构、链接等方面的可用性,在评价技术上通过对网站结构的测试或结构的可视化表示、访问日志的分析等获取相关信息加以评判;内容方面是指根据构建该Web的目的,是从语义上对内容的组织,体现在网页主题逻辑和网页内容的相互关联等方面上。因内容体现了设计者的主观性,目前在Web的评价上往往只能通过用户实际操作,根据个人判断加以评判,很难实现自动化的评价分析。  针对这种情况,提出一种基于本体的WEB站点语义结构评价模型,该模型主要包括三大部分:网页处理、站点语义结构分析、评价体系结构,其中网页处理又包括站点拓扑结构获取、页面结构分析和网页分类,主要用于获取站点的网页主题概念和链路关系;站点语义结构分析中本文提出了一种语义结构的生成算法,该算法依据领域本体的概念关系,将之前获取的网页主题概念和链路关系按照一定的规则重新组织成站点的语义结构,并且挖掘其中的含义,用于后续的自动评价部分;评价体系结构是针对站点内容信息和结构方面提出的一套评价指标,依据这些指标,采用混合评价方法对站点进行半自动化评价,最后给出一个评价结论。
其他文献
随着计算机的普及,越来越多的儿童开始使用计算机。无论是在课堂还是在家里,他们利用计算机玩游戏、学习知识,计算机正在逐渐改变儿童的生活、学习方式。讲故事在儿童的成长过程
学位
随着社会的发展和政府机构改革的深入,各个政府职能部门之间的协同工作显得越来越重要,电子政务的复杂度日益增加,原有的办公模式已经不能适应日益增长的事务处理、信息共享等方
手写体数字识别,在模拟人工智能、计算机文字处理等方面具有巨大的应用前景。世界各国的模式识别研究者都为此做出大量的研究,提出了很多图像预处理算法和识别算法。然而无论
随着企业对决策管理信息需求的不断增加,传统的OLTP(联机事务处理)数据库系统已无法满足客户的要求,数据仓库和OLAP(联机分析处理)技术正是为解决这一矛盾而产生的新的数据库
对等网络应用在Internet上的日益流行,为Internet乃至整个社会带来了信息共享的革命。准确地测量、深入分析对等网络的拓扑特征,研究对等网络在各种安全事件情景中的可生存性,对
近年来,随着互联网的快速发展,越来越多的网络服务需要根据用户IP地址所在的地理位置才能更好地被提供。IP地址与地理位置相关联的过程就称作IP定位。IP定位在如今的互联网服
随着互联网上多媒体音频、图像、视频等多媒体数据数量的迅速膨胀,人们越来越需要一种新的检索方式,使得检索能够跨越不同类型的多媒体数据(如图像、音频等),从而帮助人们获得多
随着Internet的广泛应用,应用范围也从电子邮件、网页浏览扩展到了文件共享和下载,而文件下载和共享应用首选的网络结构是P2P结构。随着Internet应用的深化,社会网络的概念日益
随着大数据技术的发展,NoSQL数据库变得流行,人们对此类技术的期望和要求也越来越高。当非关系型数据库最开始被提出时,只是为了解决稳定的海量数据存储及简单的并发查询。但
随着我国电子政务的迅速发展,各职能部门积累的基础数据总量可观,但由于这些数据分别由相互孤立的应用系统产生和管理,其服务范围局限在个别应用或部门内部,各个数据库之间存
学位