基于概念的若干知识表示模型及相关方法研究

被引量 : 0次 | 上传用户:nannalee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
形式概念分析、本体和事件这三个新兴的基于概念的知识表示模型,深入地研究概念的本质和概念之间的关系,但它们的侧重各不相同,形式概念分析主要侧重于研究概念的形成,本体更注重如何表示概念及概念之间的关系,而事件则以研究动词性概念为核心注重表示概念的结构。本文围绕这三个模型,研究它们各自存在着的一些问题,根据它们各自不同的侧重,展开它们的结合研究。本文的研究内容和创新点主要包括:(1)模糊概念格结构上的繁杂给其应用造成了障碍,本文提出基于概念聚类的模糊概念格约简方法,该概念聚类以所定义的模糊概念格中概念节点向量为概念之间相似度的度量基础,在模糊概念格节点间进行聚类,形成概念类,进而生成模糊概念层次,成为模糊概念格的一个约简形式。在UCI数据集上进行实验,以验证约简的有效性,结果表明约简很大程度上压缩了模糊概念格,同时,约简并未丢失模糊概念格中的有效信息。这意味着基于概念聚类的模糊概念格约简将有效地提高模糊形式概念分析应用时的时空性能,并且不会降低应用的质量。(2)为帮助解决概念及概念之间关系的自动获取这一本体构建的难点问题,提出基于模糊概念层次的本体生成方法。它利用形式概念分析的良好的数学性质和完善的生成工具,挖掘出概念,特别是抽象概念,以及概念之间的分类关系,通过概念和关系映射,自动将模糊概念层次中的概念以及概念之间的泛化和例化关系映射成本体中的概念以及概念之间的分类关系,从而减少了专家在本体生成过程中的参与程度,实现了更高程度的自动化。(3)经典形式概念分析方法主要针对单值形式背景,但现实世界中的问题经常会出现属性值是区间数的情况。为处理这类问题,本文提出区间形式概念分析。它是针对现实中普遍存在的区间数构造的,处理能力扩展到了区间数上。它采用区间数分解的属性定标方法,使形式概念分析可以处理由区间数表示的对象和属性关系表,进而构成区间形式背景,以生成区间概念格。实验表明区间数分解的属性定标可以有效地处理信息表中的区间数以生成形式背景;区间概念格的生成算法具有良好的时空性能。区间形式概念分析扩展了形式概念分析的处理能力,拓宽了它的使用范围。(4)提出一种新的事件表示模型和提取方法。该事件表示模型采用事件多元组的模式,相对于已有的事件三元组等事件表示模型更为灵活,避免了三元组等事件表示模型过于简化、无法完整地展现事件的全貌、从而带来的在实际应用中存在的问题;而且该事件多元组模型不仅考虑与事件相关的命名实体(即事件发生的时间、地点和参与者),还考虑与事件发生相关的重要的名词性概念和术语,从而可以对一些较抽象和较专业的事件进行表示。在该事件表示模型的基础上,提出了从文本中提取事件的方法,形成了一种新的基于事件的自然语言处理方法,它利用对自然语言文本的词法分析和句法分析等,能够自动地从自然语言文本中提取事件。基于事件的表示模型的提出拓展了现有的基于事件的知识表示模型,事件提取方法提升了现有的基于自然语言处理技术结合统计学方法的事件提取方法,还将为人工智能、自动文摘、文本处理等领域的推进和发展提供理论模型和应用方法。(5)将基于事件的知识处理技术引入到本体学习中,形成了基于事件的本体生成方法。该方法在手工生成的领域核心本体的基础上,自动地从通用本体和自然语言文本中学习领域概念及概念之间的关系。其中,核心的方法是基于事件的概念和关系学习,它对领域文本进行基于事件的自然语言处理,自动提取领域文本中的事件,通过对提取的事件的解析,获取概念及概念之间的关系,特别是概念之间的非分类关系,这从一定程度上解决了本体生成过程中非分类关系生成难的问题,实现了概念之间关系的自动获取。这一基于事件的本体学习方法是可以进行迭代的,将该方法前一次生成的领域本体和领域专家新提供的领域文本作为本次学习的输入,可进行新一轮的学习,直到获取满意的领域本体为止。实验表明,该方法可以有效地获取领域概念及概念之间的关系,特别是概念之间的非分类关系,从而生成领域本体。(6)设计了基于事件和形式概念分析的自动文摘方法eFCASum。它为基于事件的自动文摘提供了新的方法,是在本文提出的事件技术的基础上,从待摘要文档中提取出事件,经去除冗余和互斥事件处理后,生成形式背景,以获取与其同构的概念格用以判定事件的相关性,进而计算出事件的重要性,再结合事件的情境的权重,衡量出与事件对应的语句的重要性,用以提取文摘。在国际上标准的自动文摘评测语料库上对该方法进行了评测,取得了良好的评测结果,证实了方法的有效性。该自动文摘技术的发展还可解决本体中实例丰富的问题,为本体及其应用技术的提高提供一定帮助。综上所述,本文针对形式概念分析、本体和事件这三个模型各自存在的问题及它们的结合进行研究,事实上,它们各自存在的部分问题可以通过它们的结合研究解决,特别是可以利用形式概念分析和事件来解决本体构建这一本体工程中的难点。因此,在理论和应用上建立和加强形式概念分析和本体相结合的相关领域的研究是一个重要的研究方向,将事件技术引入本体生成及知识处理领域中将取得良好的效果,它们的结合研究有着非常好的前景和重要的研究意义。
其他文献
刑事司法鉴定制度是刑事诉讼中一个重要环节。刑事司法鉴定具有专门性、科学性、中立性。刑事司法鉴定可分为四大类:法医学鉴定、物证技术学鉴定、司法精神病学鉴定、司法会计
所谓讯问是指公安、司法人员对涉嫌犯罪而受到刑事追诉的人所进行的正式地有系统的提问。讯问依据所处的刑事诉讼阶段可分分侦查讯问、审查起诉讯问和审判讯问。在侦查阶段,
家形象是一国的外部公众和内部公众对该国的相对稳定的总体认识和综合评价,一国的国家形象取决于该国自身的发展和国际社会中价值观念、文化意识、行为规范等外部语境因素。
新中国成立至今,公证业务已经在我国开展了几十年,公证对我国社会经济发展和国际交往做出了不可磨灭的贡献,但由于我国公证制度本来就是舶来品,民国时期植入日本公证制度,新
小芯样试件检测结构混凝土强度试验研究与探讨是在随着建筑技术的进步,现行的国家规范已不能满足在实际工程检测中遇到的问题的情况下提出的,为了解决高层建筑和公路工程中使
种类繁多、生境复杂的海洋微生物是生物多样性的重要组成,是一种极具有开发价值的生物资源,因此近年来对海洋微生物资源的开发与利用越来越受到人们的重视。光合细菌是一类能
与游泳项目相关的力量素质好坏与游泳运动员成绩的最终表现有密切联系,力量素质的提高是通过平时在专项训练中采用相关的力量训练来完成的。本研究运用生理生化指标,对我国优
展览:国家级非物质文化遗产——苏州缂丝、核雕作品晋京展时间:2011年3月5日—2011年4月10日地点:北京爱慕美术馆非物质文化遗产的保护和传承早已经被重视和呼吁,近些年对非
兰鹤百草颗粒由人参、绞股蓝、仙鹤草等制成,是根据著名老中医在多年临床经验基础上总结出来的药方研制而成的新药。该药具有补气生津,清热解毒,活血消肿,软坚散结的功效。本文对
海参(sea cucumber, holothurians)归属无脊椎动物棘皮动物门,以其较高的营养价值和药学价值而被列为“八珍”之一。全世界约有900多种海参,我国约有140多种,其中可供食用者