文本单元向知识单元转化的模型与映射算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xgzyf2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的广泛普及和应用,人们对知识服务的需求越来越强烈。人类现有知识绝大部分是以文本为载体的,如何让计算机更好地从文本中自动获取知识,一直是知识工程领域需要解决的难题之一。本文围绕文本知识学习映射展开了讨论和研究。首先介绍了文本结构分析和文本本体学习方法,主要针对文本的物理结构和逻辑结构,本体学习的概念、原理、方法等做了详细阐述,并提出了一种基于TFIDF(词频,逆文档频率)的中文文本特征抽取算法。接着本文提出了基于句型规则的自举本体学习方法,介绍了整个方法的框架,并对在这个框架下的几个关键的技术问题,包括文本预处理、本体片断的定义、句型规则的语法,分别做了更为详细的介绍。基于对文本单元向知识单元转化的模型和映射算法的分析,本文开发了中文文本知识抽取系统,并进行了实验分析,得到了一些有意义的结果,初步验证了文本知识学习映射方法,另外本文分析了影响结果的因素。最后,基于文章的核心——文本特征获取以及基于句型规则的自举本体学习,本文对进一步工作做了探讨和展望。本文的创新工作和结果主要有:(1)改进了基于海量智能分词的中文自动分词算法,为文本特征抽取打下基础;(2)将以词权重作为文本特征进行奇异值分解的思想运用到文本知识的获取中,并建立了一些的句型规则语法;(3)设计并实现了中文文本知识获取系统,对本文提出的方法进行了有效验证。
其他文献
运动过程中骨骼肌产生的高水平反应物会导致肌肉损伤和肌肉功能受损,一般认为补充抗氧化剂可以保护肌肉不受损伤.无论对于运动爱好者还是专业运动员,抗氧化剂都是最常用的运
随着知识经济的到来,信息环境的变化以及信息技术的发展,知识作为一种重要的生产资源被越来越多的企业所重视,此时,知识管理对企业来说就显的尤为重要。而企业大学作为一种新
摘 要:探矿工程作为我国地质勘查中的一项重点内容,对我国的地质找矿、新能源的勘查与利用都有着非常重要的意义。随着社会经济的不断发展,能源需求量不断增加,使得我国的能源短缺问题变得越来越严重,探矿工程作为我国新能源查找和开发的重点项目工程,加强对它的发展研究不仅可以促进资源的可持续发展,还可以进一步加深人们对地质环境的认识,更好的维持社会的稳定发展。本文中,笔者将从探矿工程的基础介绍出发,详细的分析
网络日益成为科研工作者学术研讨、研究合作、信息交流的重要平台,为此,研究网络结构单元中学术信息分布现象及规律,能使人们更有效的组织网络资源,有助于建立更有效的搜索方法,从