基于中文科技论文的本体交互式构建方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:chelseainter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
同行评议是科学基金项目评审工作的核心,其效果主要取决于同行专家的选择。本质上,同行专家的选择过程是在已知项目知识的条件下,从专家库中搜索出与己知项目具有相似知识的专家的过程,也可以看作是一个语义检索的过程。本体是语义检索的基础和核心,本体质量的好坏直接影响到语义检索的效果。同时,本体的手工构建由于耗时费力也严重阻碍了本体大规模的应用。因此,本体的自动构建是一个亟待解决的问题。 本文在对国内外本体自动构建相关研究进行全面分析和总结的基础上,提出了基于中文科技论文的本体交互式构建方法。该方法基于系统集成创新的思想,充分利用现有的自然语言处理技术和统计学习方法,从特定领域内的自然语言文本中提取领域概念以及概念间的语义关系。本文的核心工作包括以下三点: (1) 领域概念的提取。主要是通过基于长度递减与串频统计的文本切分方法以及汉语短语词法规则,提取领域的候选概念,然后通过统计方法分析领域归属度并基于词典进行概念约简,得到由多个词和短语组成的与领域相关的概念。 (2) 语义关系的获取。主要是通过关联规则挖掘、依存句法分析以及机器学习方法来学习表达语义关系的关系句法模式,应用已得到的句法模式析取语义关系,并对概念间的语义关系进行命名。 (3) 本体交互式构建原型系统的分析、设计和实现。系统主要分为三个模块:文本管理、本体构建和本体维护,其中重点介绍了本体构建模块的功能和具体实现。 在此基础上,本文以“计算机科学”及其子领域“计算机硬件”的文本为试验对象,基于本文提出的本体交互式构建方法和原型系统构建了一个小规模的领域本体,并对试验结果进行了分析。试验结果表明,本文提出的基于中文科技论文的领域本体构建方法具有较高的准确性,并且不依赖于领域词典,适用于任何领域本体的构建,具有较大的通用性,能够辅助领域专家更高效、准确地完成本体构建的任务。
其他文献
脑血肿是由脑组织各种病因以及脑外伤引起的脑部病理反应,常导致脑部疾病患者病情加重,乃至死亡的最常见并发症之一。人脑是人体结构最复杂和最重要的部分,而脑组织对不同病
针对一类不确定性不满足强匹配条件的线性不确定系统,研究了多目标约束下的满意容错控制设计方法。在连续型的执行器故障模式下,利用线性矩阵不等式技术,分析了多目标约束控
近年来,人们对船舶横摇稳定性的要求越来越高,既要求在航行中减摇,也要求在停泊或漂流状态下减摇,尤其是大型游艇、具有舰载武器的军用舰船、科考船以及其它一些进行海上作业的特
三轴试验仪是人类为研究土的应力—应变关系而设计开发出的一种基础科学试验仪器。随着土工试验的发展,对三轴仪试验的要求也越来越高,土工三轴仪将向精密化,自动化和网络化方向
电子提花机是生产高质量提花织物的一种先进纺织设备,集中采用电子、通信、计算机等多项技术来控制提花笼头。引入嵌入式系统和嵌入式微处理器技术,易于实现电子提花机的高性能
励磁控制器是发电机的主要控制装置,对于提高电力系统的稳定性及其动态品质具有关键的作用。而随着电力系统自动化程度的不断提高,在对其核心控制芯片的不断更新的同时,对励
现代化大生产对机械设备运行的稳定性、可靠性提出了更高的要求,相应的机械设备状态监测和故障诊断的意义也变得更加重要。但是传统的振动监测仪硬件采用8位或16位的MCU作为其
自1974年Rosenbrock在研究复杂电路网络系统中首次正式提出广义系统问题以来,人们又在经济管理、电子网络、生物工程和航空航天技术等领域发现了许多广义系统的实例。而广义
交通仿真是一种通过再现道路交通过程,对交通状况、过程和各种控制管理措施做出科学的分析和评价,验证改善措施合理性的一种技术。不同交通流仿真模型的选取,将直接影响到仿真结
燃料电池是一种高效、低噪音和少污染的洁净能源。在能源问题层出不穷的今天,燃料电池由于自身的优点已经成为全球能源研究的热点,其在固定电站,汽车及消费类电子中已经开始应用