基于语义网的信息处理系统设计

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:showlisy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet具有的海量、异构、动态变化等特性使Web信息抽取不同于传统信息抽取,同时带来了新的挑战。首先,面对呈几何级速度增长的巨大的Web信息空间,如何自动高效地处理海量Web信息是Web信息抽取的一个难点。其次,Web页面的异构性使如何在各式各样的Web页面里准确识别所需信息点成为一个较大的难点。最后,Web网站的动态更新使得保持信息抽取的适应性也成为一个有待解决的问题。Web信息抽取承接了传统信息抽取技术研究的成果,其核心是将分散在Internet上的半结构化的HTML页面中的隐含的信息点抽取出来,并以更为结构化、语义更为清晰的形式表示,为用户在Web中查询数据、应用程序直接利用Web中的数据提供便利。本文首先介绍了信息抽取技术及其产生背景和发展历史,分析了信息抽取系统体系结构、信息抽取的分类及信息抽取的关键技术和衡量指标。本文还介绍了ontology的基本知识。在此基础上提出了一种基于语义的信息抽取新方法。在本方法中,我们把信息抽取和ontology结合起来,先利用领域ontology里的概念、关系、关键字等自动生成抽取规则(Rule),然后对文章,句子进行语法分析预处理,再利用语法分析的结果和先前生成的抽取规则一起对文档进行信息抽取,最后把抽取的结果以记录的形式输出。根据上述方法并结合工程实际情况,设计了一个基于语义的信息抽取系统。在本文中,提出了基于语义的信息抽取系统的总体框架、各主要模块的设计,还着重说明了基于语义的信息抽取方法。此外,还对本系统的实现方法,包括各个主要部分的数据结构,流程图等进行了详细的阐述。最后介绍了此系统的运行界面及利用此系统对一些样本进行抽取后的结果并对结果进行了分析。
其他文献
传统的EBMT(Example-Based Machine Translation,基于实例的机器翻译)方法是建立在大规模的实例库基础之上的,存在着精确匹配率不高,模糊匹配时产生译文质量较差等缺点。利用
本文针对综合信息保障一体化平台的应用需求,基于863成果操作系统,利用安全操作系统对大型数据库、典型中间件的良好支持,实现了J2EE架构的软件总线调度控制系统。本文深入分
在对当前国内外动态心电监护领域发展情况的调查和分析的基础上,本文提出并实现了一种新型的动态心电监护系统。该系统在数据传输,结构设计,数据存储,数据处理等方面进行了独特的
随着无线传感器网络在军事、医疗、环境监测等领域应用的不断广泛,传感器网络的安全问题日益突出。入侵检测是无线传感器网络安全研究的一个重要领域。当前,设计出一种适合传感
约束可满足问题,广泛存在于科学研究和工程实践中。如人力资源配置问题、农作物布局优化问题、工程设计方案优化问题和资源分配优化问题等,都属于约束可满足问题。这类问题的特
随着计算机和网络技术的不断发展,云计算逐步作为一种全新的计算模型,被提出并不断加以改进,经过学术界和产业界的共同推进,正在从理论基础走向实践,我国政府也投入了大量的财力和
随着科技的不断进步,LEO卫星网络成为一种必不可少的通信网络。就目前而言,多媒体业务成为LEO卫星通信系统的主要业务。单一业务的信道预留策略已经不能满足当前需要,于是针
云计算是一种在因特网上涉及数据和计算外包的计算模式,该模式是基于虚拟化和分布式计算技术之上。快速发展的云市场正在提供商和开发资源的服务生态系统中涌现出许多新的服务
移动Ad hoc网络具有组网速度快、抗毁、自愈能力强等优点,在军事和民用领域得到越来越广泛的应用。Ad hoc网络研究的创新性、前沿性、多学科交叉性以及实用性,使得这一研究领
图像序列中动态目标的检测与跟踪已成为计算机视觉的一个重要的研究方向。随着计算机硬件技术和计算机视觉技术的发展,基于计算机视觉的ITS、无人侦察技术等称为可能,其中视频