论文部分内容阅读
摘 要:控制阀产品选型设计对自动化系统有重要影响,检索是实现选型设计自动化的有效手段。传统的检索是基于精确本体的,不能完成精确语义信息挖掘,提出一种基于粗糙本体的控制阀产品检索方法,支持控制阀产品的智能选型。首先,建立控制阀本体库,将其扩成生成粗糙本体;其次,对查询语句进行自然语言处理,提取关键字并利用本体和粗糙本体库上下位扩展检索实例的算法进行语义扩展;最后,基于布尔模型表示的文档,结合语义扩展后的关键字进行文档和查询的匹配实现了一种基于粗糙本体的控制阀产品检索原型系统,验证了提出的检索方法的有效性。
关键词:粗糙本体;语义扩展;查询匹配;检索
一、简介
控制阀是自动化系统的重要组成部分,合理的选择控制阀对于自动化系统极其重要。然而,产品选型设计往往关联着需求方与供给方不同企业,其来自需求方的应用需求同来自供给方的产品属性之间往往存在着巨大的“语义鸿沟”,造成自动化选型的困难性[1]。
检索是实现选型设计自动化的有效手段。然而,传统的基于关键字检索方法仅仅考虑到了语法层次的问题,即检索条件在数据库中是否能够得到匹配,完全摒弃了检索条件的概念特征;从知识表示的角度来看,关键词的检索仅仅考虑了数据匹配,而没有考虑数据本身的结构特征,势必无法支持复杂的检索需求,因而难以应用于控制阀产品的自动化选型中[2,3]。本体具有“概念化、形式化、明确性、共享性”[4]的优良特性,基于它的检索方法能够有效地捕捉用户的检索意图,合理组织底层数据,因而受到广大学者的积极关注[5-7]。然而,精确本体不能很好挖掘隐藏的语义信息,导致检索的全度和精度不理想。
针对这些问题,本体提出了一种基于粗糙本体的控制阀产品检索方法,通过引进粗糙集到本体中,粗糙本体的概念是S.Ishizu提出的,使本体能够表达不精确的信息,能够解决不精确信息影响检索结果的问题。本文包括:粗糙本体库的构建,查询语句的自然语言处理及基于本体和粗糙本体库上下位语义扩展,基于语义扩展后的关键字和文档的查询匹配。
语义信息检索是一种基于概念和概念之间关系的匹配机制,语义信息检索的重点和难点是找到不同概念之间的映射关系,于是本文用本体和粗糙本体来实现检索。
对比用精确本体进行语义扩展,粗糙本体能客服精确本体中信息不完整的问题,粗糙本体是用粗糙集理论对精确本体的扩展。粗糙本体的实现难点是知识的表征以及粗糙本体的定义问题。
二、控制阀本体库和粗糙本体库
基于粗糙本体的检索方法利用本体“概念化、形式化、明确性、共享性”的特点,可以有效地分析用户的检索意图,合理组织底层数据,实现高效的产品检索工作。文章中的控制阀本体源于我们先前的工作通过计算将满足设定阈值的词加入查询,本体模型基于NIST的CPM而扩建。粗糙本体用粗糙集理论对精确本体的扩展,它不仅可以通过精确概念得到粗糙概念,而且继承了精确本体的可扩展性,因此用它来表示粗糙概念。
粗糙本体定义
粗糙本体表达为O=,C是粗糙概念集,P是属性集,R是粗糙概念间的关系集。为了描述概念粗糙度,粗糙集的上近似和下近似被用来表述概念边界粗糙度。粗糙概念C是一个三元组C=(U,L,Y),对于一个给出的内涵Y,U是概念内涵的上近似扩展,L是概念内涵的下近似扩展。
表征:将粗糙本体引入语义信息检索的前提条件就是知识表征。
一个代表性的OWL表征的粗糙本体模型:
粗糙本体是基于粗糙集对精确本体的扩展,因此具有本体库的可扩展性[11]。用OWL编码的粗糙本体,粗糙度的描述需要增加到对象关联中,也就是上近似扩展和下近似扩展。表达OWL粗糙本体分成几步:(1)定义粗糙类;(2)定义子类;(3)定义粗糙概念上近似扩展和下近似扩展;(4)定义精确类的函数范围。分词后提取得到的关键字在本体树找到对应的位置,同时也在粗糙本体树中找到相应的位置,然后同时进行语义扩展,找到精确本体中的上位词及相对具体的下位词。(作者单位:北方民族大学计算机科学与工程学院)
创新项目:北方民族大学研究生处创新项目(YCX1563)
参考文献:
[1] 白静.产品智能选型设计方法及应用研究.博士后论文.2011:1-6
[2] Mousavi SM, Jolai F, and Tavakkli-Moghaddam R. A Fuzzy Stochastic Multi-Attribute Group Decision-Making Approach for Selection Problems[J]. Group Decision and Ngotiation. 2013.22(2):207-233.
[3] Tavana M, Khalili-Damghani K, and Sadi-Nezhad S. A fuzzy group data envelopment analysis model for hightechnology project selection: A case study at NASA[J]:Computers & Industrial Engineering.2013.66(1):10-23
[4] 王继东,张瑜,李娜.基于本体的语义检索技术研究实现.计算机技术与发展.2009.10.
关键词:粗糙本体;语义扩展;查询匹配;检索
一、简介
控制阀是自动化系统的重要组成部分,合理的选择控制阀对于自动化系统极其重要。然而,产品选型设计往往关联着需求方与供给方不同企业,其来自需求方的应用需求同来自供给方的产品属性之间往往存在着巨大的“语义鸿沟”,造成自动化选型的困难性[1]。
检索是实现选型设计自动化的有效手段。然而,传统的基于关键字检索方法仅仅考虑到了语法层次的问题,即检索条件在数据库中是否能够得到匹配,完全摒弃了检索条件的概念特征;从知识表示的角度来看,关键词的检索仅仅考虑了数据匹配,而没有考虑数据本身的结构特征,势必无法支持复杂的检索需求,因而难以应用于控制阀产品的自动化选型中[2,3]。本体具有“概念化、形式化、明确性、共享性”[4]的优良特性,基于它的检索方法能够有效地捕捉用户的检索意图,合理组织底层数据,因而受到广大学者的积极关注[5-7]。然而,精确本体不能很好挖掘隐藏的语义信息,导致检索的全度和精度不理想。
针对这些问题,本体提出了一种基于粗糙本体的控制阀产品检索方法,通过引进粗糙集到本体中,粗糙本体的概念是S.Ishizu提出的,使本体能够表达不精确的信息,能够解决不精确信息影响检索结果的问题。本文包括:粗糙本体库的构建,查询语句的自然语言处理及基于本体和粗糙本体库上下位语义扩展,基于语义扩展后的关键字和文档的查询匹配。
语义信息检索是一种基于概念和概念之间关系的匹配机制,语义信息检索的重点和难点是找到不同概念之间的映射关系,于是本文用本体和粗糙本体来实现检索。
对比用精确本体进行语义扩展,粗糙本体能客服精确本体中信息不完整的问题,粗糙本体是用粗糙集理论对精确本体的扩展。粗糙本体的实现难点是知识的表征以及粗糙本体的定义问题。
二、控制阀本体库和粗糙本体库
基于粗糙本体的检索方法利用本体“概念化、形式化、明确性、共享性”的特点,可以有效地分析用户的检索意图,合理组织底层数据,实现高效的产品检索工作。文章中的控制阀本体源于我们先前的工作通过计算将满足设定阈值的词加入查询,本体模型基于NIST的CPM而扩建。粗糙本体用粗糙集理论对精确本体的扩展,它不仅可以通过精确概念得到粗糙概念,而且继承了精确本体的可扩展性,因此用它来表示粗糙概念。
粗糙本体定义
粗糙本体表达为O=
表征:将粗糙本体引入语义信息检索的前提条件就是知识表征。
一个代表性的OWL表征的粗糙本体模型:
粗糙本体是基于粗糙集对精确本体的扩展,因此具有本体库的可扩展性[11]。用OWL编码的粗糙本体,粗糙度的描述需要增加到对象关联中,也就是上近似扩展和下近似扩展。表达OWL粗糙本体分成几步:(1)定义粗糙类;(2)定义子类;(3)定义粗糙概念上近似扩展和下近似扩展;(4)定义精确类的函数范围。分词后提取得到的关键字在本体树找到对应的位置,同时也在粗糙本体树中找到相应的位置,然后同时进行语义扩展,找到精确本体中的上位词及相对具体的下位词。(作者单位:北方民族大学计算机科学与工程学院)
创新项目:北方民族大学研究生处创新项目(YCX1563)
参考文献:
[1] 白静.产品智能选型设计方法及应用研究.博士后论文.2011:1-6
[2] Mousavi SM, Jolai F, and Tavakkli-Moghaddam R. A Fuzzy Stochastic Multi-Attribute Group Decision-Making Approach for Selection Problems[J]. Group Decision and Ngotiation. 2013.22(2):207-233.
[3] Tavana M, Khalili-Damghani K, and Sadi-Nezhad S. A fuzzy group data envelopment analysis model for hightechnology project selection: A case study at NASA[J]:Computers & Industrial Engineering.2013.66(1):10-23
[4] 王继东,张瑜,李娜.基于本体的语义检索技术研究实现.计算机技术与发展.2009.10.