基于Text2Onto的中文本体学习技术研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:bfhx1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新一代互联网——语义Web——研究的不断深入,本体(ontology)正在成为人工智能和知识工程中一种重要的工具,在知识的获取、表示、分析和应用等方面具有重要的意义。本体的手工构建是一项繁琐而辛苦的任务,极易导致知识获取的瓶颈。因此,Web本体的可获取性已被学术界公认为是制约语义Web成功的巨大挑战之一,能否减低本体构建成本,实现本体的半自动自动构建逐渐成为本体研究的一个关键问题。从现有信息源,包括文本、词典、遗留知识库、WWW文档等,获取领域知识、以自动方式构建或扩充本体,即所谓的本体学习(Ontology Learning),是开发本体的有效途径。相应的,对于语义Web在中国的推广和应用而言,中文本体的获取是非常重要的。如何从现有的各领域的大量中文文献中获取本体,同时提高所得本体的质量使其能被有效利用,成为语义Web在中文环境下推广的一个重要课题。本文在Text2Onto框架下,针对中文的特点及中西文之间的差别围绕中文本体的获取技术展开了讨论和研究,其中利用了ICTCLAS分词工具。首先我们介绍了Text2Onto的优点、系统架构、工作原理及关键的算法。然后针对中文本体学习这一领域存在的问题提出了基于Text2Onto的中文本体学习技术框架,并对这个框架下的几个关键的技术问题,包括中文语料预处理、术语概念抽取、语义关系抽取,分别作了更为详细的介绍,给出了中文术语概念抽取及过滤的具体算法。最后,分析了现有本体学习系统的体系结构,在Text2Onto的基础上整合了中文分词,加入中文概念抽取及过滤算法,实现了中文本体学习系统框架。通过实验,我们认为基于Text2Onto的中文本体学习技术研究是对中文本体获取的一次非常有意义的尝试,初步解决了中文术语概念的抽取及过滤问题,并为后续的中文本体学习技术研究打下了良好的基础。
其他文献
无线传感器网络综合了传感器、嵌入式系统和无线通信等技术,是目前国内外研究的热点领域之一。随着无线传感器网络应用的逐渐推广,传感器网络的性能参数测量也就受到了越来越
伴随着计算机技术的迅猛发展以及互联网的快速普及,人们所接触的数据量(包括有结构和无结构的文本数据)呈现爆炸式增长。当前,如何有效快速地从海量数据中挖掘出有价值的信息具有
视频语义自动标注是基于内容图像检索(CBIR)中很重要且很有挑战性的工作。由于计算机对图像信息的理解和人对图像信息的理解存在着客观区别,检索系统中就难免存在计算机认为
任务调度问题是计算机科学研究的基本课题,多核系统的出现为任务调度问题带来了新的变化。多核系统的任务调度问题首先考虑能否在保证任务得以完成情况下,寻求分配方案使得处
随着自动化测试技术的不断发展,很多公司都为自动化测试开发了专业的测试软件。但是不同的自动化测试软件,所能够识别并运行的自动化测试脚本都是基于完全不同的语言。也就是
随着互联网在全球范围内的快速发展,人们面临的信息呈指数增加。面对Internet上信息的纷繁芜杂,如何快速、准确全面获取信息,文本的分类技术作为一种有效组织信息,方便信息定
无线传感器网络因其满足恶劣条件和特殊需求,已经成为学术界和工业界的热门研究领域。大量成本低、体积小、功能强的无线传感器网络节点可以任意布置在恶劣的环境中或者特殊
DSP技术正迅速应用于通信、电子、计算机等各个领域,尤其在信号处理方面具有独特的优势,用DSP技术来实现信号与系统实验装置对于课程教学、专业发展和工程实践等方面具有十分
为了解决现有Internet面临的高速交换、服务质量(Quality of Service,QoS)保障、网络安全和移动性方面的挑战,四川省网络通信技术重点实验室提出了“单物理层用户数据交换平
颅面形态学通过研究找出人的颅骨和面貌之间的形态关系,为颅骨面貌复原提供科学依据,近年来这方面的研究受到了广泛的关注和重视。本文针对颅面信息提取与三维重建展开研究,