基于切片方法的XML信息抽取应用研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:jiangguoliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet/Intranet发展,Web应用领域扩大,XML已成为面向Web的网络语言.基于XML信息抽取成为与Web语义相关的重要研究课题.该文在分析XML语义及基于SBT信息抽取方法基础上,利用程序切片思想,根据XML语义特点,逐步深入地建立了将XML文档结构转化为逻辑公式集的模型,用以描述XML标记及标记数据间的语义依赖关系.同时提出XML文档切片理论和方法.这一理论方法可应用于Web信息抽取与数据挖掘等方面.
其他文献
论文在描述了任务和研究目标之后,首先对课题中所涉及到的背景知识进行了阐述.由于该课题采用TMN(电信管理网络)关于网管的规范和方法论进行设计和实现,在论文的第二章着重介
UMTS系统是第三代移动通信系统(3G)的代表之一,它将分组交换引入无线通信系统,为用户提供多种数据服务.对于分组域的移动管理,UMTS的核心网采用了GPRS技术.由于3G的发展方向
本文首先通过介绍面向对象数据库的产生背景,发展和现状,比较了其和传统关系型数据库在基本特性、开发方式、适用领域、性能上的区别,指出了面向对象数据库更合适用于有数据类型
本文把P2P模型和基于本体 (Ontology) 的形式化知识管理方法结合起来,用动态演变的局部本体(Local Ontology)来跟踪单个用户的需求变化,用所有局部本体的融合和映射(Merging an
数字水印技术,是指在数字化的多媒体信息中嵌入某种不易察觉的信号,在需要的时候可通过特定的算法,将此信号提出,用以确认身份的技术. 该文介绍了数字水印系统的嵌入与检测模
基于位置服务的空间查询在交通导航、救援服务以及数字战场等诸多领域有着广泛的应用前景。近年来,随着无线通信和全球定位系统(Global Positioning System,GPS)定位技术的发
随着网络技术的发展,XML在各个领域的应用越来越频繁,于是以XML格式表示的数据大批量的出现,为了有效地管理这些数据,原生XML数据库应用而生。这是一种根据XML数据的特点设计
本文首先对电子邮件基本原理做了简单的介绍,并介绍了SMTP、POP3以及IMAP等相关的电子邮件协议。探讨了LDAP(Lightweight Directory Access Protocol)的原理、概念和具体应用
目前,呼叫中心在技术和应用上都得到了快速充分的发展,平台之间技术上的差异已经逐渐缩小;而平台功能的兼容性及辅助子系统的功能将决定平台是否在激烈的市场竞争中脱颖而出.
OPC是工业控制和生产自动化领域中硬件和软件之间的接口标准。它是一种基于Microsoft公司DCOM的技术。由于DCOM的平台相关性,因此不利于OPC技术的广泛应用。 由于代表分布