基于本体的网站结构知识获取与分析

来源 :北京化工大学 | 被引量 : 4次 | 上传用户:nicolewyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文将本体理论引入到网站结构知识的获取与分析中,通过语义明确、定义统一的术语和概念,来分析网站结构知识的本质,提高了知识共享和重用的程度。文中深入分析了网站结构,对比网站结构知识与其他知识的异同,总结了网站结构知识的内涵和特点。根据网站结构知识的作用及获取方法的不同,把网站结构知识分为节点结构、频繁路径和频繁集三部分。节点结构主要描述网站的拓扑结构,频繁路径和频繁集则描述网站结构中有特殊关系的链接和节点。然后根据网站结构知识的特点,建立了网站结构本体(WSAO),并定义网站结构本体描述语言(WSAOL)。基于网站结构本体的知识获取,本文重点研究了以页面源文件为知识的网站节点结构知识获取和以Web日志为知识源的用户频繁访问路径挖掘,并分别给出了两种知识获取的获取算法。本文还提了两种网站结构知识分析规则,网站结构变更分析和网站优化策略分析。结构变更分析中借鉴概念图相似度的思想,提出了节点结构变更率的概念。节点结构变更率根据节点结构图的结构进行计算,又分为页面变更率和链接变更率。优化策略分析主要提出了一种筛选规则,利用该筛选规则从用户频繁访问路径中挑选有价值的频繁访问路径,用于网站结构的调整和优化。最后本文设计了网站结构知识获取及分析系统模型,获取及分析系统从网站结构知识的概念、关系和属性集出发,建立一个便于理解和分析的网站结构知识体系,并在此基础上进行网站结构知识的可重复性分析与应用。
其他文献
随着面向对象软件开发技术的不断发展以及软件规模的不断扩大,使得系统的分析和设计变得日益复杂。软件开发中的许多关注点往往横切系统的多个模块,利用现有的编程技术(如面向
随着电子政务的推广和深入,工作流技术己成为该领域的主流技术,工作流管理的主要目标是通过调用有关的信息资源和人力资源来协调业务过程中的各个环节,使之按照一定的顺序依次进行,从而实现业务过程的自动化。在计算机和网络使用越来越广泛的今天,工作流管理系统正在吸引来自研究机构和产业界越来越多的关注。业务流程定义是对实际的业务流程进行形式化定义,一个好的业务流程定义规范是实现一个具有高度的灵活性、可靠性、可伸
过去几十年,无线传感器网络(Wireless Sensor Networks,WSNs)得到了飞速的发展,取得了一系列的成果,极大的改善了人们的生活方式和生活质量。作为极具应用和发展前景的一项高
数据库密文索引及密钥管理技术是数据库加密技术研究的难点和重点。目前,对数据库密文索引及密钥管理的研究还处于起步阶段,各方面的技术还不成熟,存在一定的缺陷。本文对数
学位
面向对象软件开发从一定程度上提高了开发者的效率和控制复杂系统的能力,然而由于动态变化的需求,软件本身的性能要求等因素,导致面向对象程序设计不能很好的解决横切关注点
随着计算机网络技术与多媒体技术的迅速发展,多媒体数字产品越来越需要一种有效的版权保护方法。作为信息隐藏技术在计算机领域的一项重要应用,数字水印为保护多媒体信息的版
视频监控系统作为一种重要的安防手段已经有很长的发展历史,在安全监控、生产过程监控、住宅小区监控等领域,已经被广泛应用,视频监控系统以其远距离监控的独特优势逐渐赢得
随着网络的普及以及新的应用如(VoD,VoIP)的出现,宽带网络服务需求(如多媒体、视频业务等)的激增,网络的突发业务流量急剧增加,基于传统模型的流量特征不再适合当前网络流量
大规模地形的实时绘制技术是目前人们广泛关注和研究的热点课题,它在战场环境仿真、地理信息系统、飞行训练、防洪减灾和户外游戏等众多领域得到了广泛的应用。目前国内外研究