基于Web的通用本体学习研究

被引量 : 0次 | 上传用户:stoneinhigh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义Web提出以来,本体(Ontology)正在成为人工智能和知识工程中一种重要的工具,在知识的获取、表示、分析和应用等方面具有重要的意义。从本体开发的角度来说,由于借助本体编辑器(如Protégé)手工开发本体是一个繁重和棘手的任务,极易导致知识获取的瓶颈。因此,Web本体的可获取性已被学术界公认为是制约语义Web成功的巨大挑战之一。从现有信息源,包括文本、词典、遗留知识库、WWW文档等,获取领域知识、以自动方式构建或扩充本体,即所谓的本体学习(OntologyLearning),是开发本体的有效途径。 目前国际上在本体学习方面的研究非常活跃,虽然已经提出了很多本体学习方法,但大部分方法都不理想。由于缺乏统一的本体学习体系结构概念和方法,虽然开发了一些本体学习方法,但这些方法难以被其他系统重用。当前本体学习系统工具多是原型系统,不能大规模实时处理网上海量信息源,也缺乏中文语料处理能力。同时,目前还缺乏有效的评价本体学习结果的标准和方法,不利于本体学习方法和工具的进一步发展。 本文就是在开放的网络环境下,综合运用机器学习和自然语言处理方法,按照分层技术原理,提出了一种新的分层本体学习方法体系,并实现了一种基于Web的多策略本体学习工具GOLF,然后讨论了本体演化和评价方法,并对本体学习框架GOLF进行了实验和评价。本文的主要研究内容如下: (1)提出了一种分层本体学习方法体系,其中包括术语自动抽取、概念学习、实例学习和分类关系学习和非分类关系学习多种关键技术。在对现有学习方法做大量改进的基础上,完全实现了本体学习全过程的无缝集成,并且在本体学习系统中集成了本体评价模块。 (2)开发了基于Web的多语种通用本体学习工具GOLF,并采用Web文档作为本体学习源,进行了跨领域、多语种实验。同时,实现本体学习过程中的本体演化管理,并对学习结果进行评价和反馈。 (3)在本体学习中引入多策略学习方法,以提高学习质量。各学习算法的组合框架采用概率组合分布,可根据不同的语料特征为每个算法设定权值,从而增强了对不同领域语料的适应性。通过实验对比分析,在学习结果的准确率和召回率方面,GOLF系统都比著名的Text2Onto系统更好。 (4)实现了中文语料的本体学习。本文所提出的方法和工具能够很好地处理多语种语料,与同类系统(大多只能处理西文文本)相比,对中文的处理能力明显加强;特别针对中文的语言学特征,引入HowNet语义词典,添加了对应于中文文本的语言学模式和停用词表,性能有明显改善。 (5)提出了一种新的基于贝叶斯决策理论的本体评价方法RiMOE,并采用RiMOE
其他文献
目的:根据传统动物模型建立一种更加贴近临床的大鼠创伤性骨髓炎模型,探讨模型动物在不同浓度金黄色葡萄球菌悬液下,存活率及感染率的发生情况;并探讨创伤性骨髓炎中骨骼肌过
目的探讨髋关节置换术中预防下肢深静脉血栓形成的护理干预效果,以期对临床髋关节置换术后预防下肢深静脉血栓形成进行研究比较。方法选取2017年1月至2018年12月大化瑶族自治
目的探讨轴向负荷MRI在腰椎退行性疾病(Lumbar degenerative disease, LDD)诊疗中的有效性和优势。方法选择重庆医科大学附属第二医院骨科2013年11月-2014年10月期间84例患有
目的:疼痛是腹腔镜胆囊切除术(LC)后24h内最常见的并发症。本研究旨在比较分析布比卡因局部浸润与帕瑞昔布静脉推注用于LC术后镇痛效果的有效性和安全性,为临床术后镇痛用药
第一部分:DSCAM和CNTNAP2基因多态性与青少年特发性脊柱侧凸患者相关性研究目的:探讨轴突蛋白Ⅳ(contactin-associated protein 2, CNTNAP2)和唐氏综合征分子(Down syndrome ce
<正>硅谷的创新浪潮在一波一波持续。然而硅谷也面临诸多挑战,其最大的挑战在于美国摒弃全球化的态度,而硅谷植根于全球市场和全球人才。硅谷和中国的创新TBR:您观察到的中国
[目的]为了解颞叶新皮质癫痫患者外科干预后神经心理学方面的改变,比较不同的治疗方案、海马萎缩情况、侧别、手术方式及术后效果,分析神经心理学方面中智力、记忆、精神障碍
图书馆建筑是与信息技术关系最密切的建筑类型之一。在当今信息化社会进程中,随着信息技术的迅速发展和广泛应用,高校图书馆的功能和使用模式也发生了巨大的变化,从原来的以
随着公共财政框架的构建和国家预算管理改革的深入,我国财政预算管理正在逐步建立由部门预算、政府采购、国库集中收付等三项制度为核心构成的公共财政预算制度。作为我国财
绩效考核是企业管理的一项重要工作。由于绩效考核多因、多维、动态等特点及考核者的情感因素,绩效考核未能取得令人满意的效果。在上述诸多因素中,指标评价体系设计不科学是