基于本体的茶学知识表示与应用的研究

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:qq81194913
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代,随着信息技术的快速发展,知识正呈现海量、多源、异构化趋势,如何对知识进行组织管理从而有效获取是信息检索领域的研究热点,本体作为一种新型的知识组织工具,具有良好表示语义关系且支持逻辑推理的特点,得到广泛的应用。茶是世界三大无酒精饮料之一,种植区域遍布全球,中国作为茶叶发源地,有着悠久的茶学研究历史,茶学知识涉及栽培、生物化学、病虫害、检验学、机械学、文化习俗、产业经济等众多领域,在此技术和知识背景下,本文以丰富的茶学知识作为研究对象,采用本体技术实现茶学知识的组织以及检索系统的本体应用,本文主要可分为三个部分:第一部分,本文首先对本体的定义、分类、应用进行了学习,又深入了解知识经济社会中组织工具的发展,对比分析各个组织工具的优势与不足,指出本体在信息组织方面受到重点关注,由于本文研究对象为茶学,属于农学一部分,因此对农学本体研究现状也做了调查分析,本体构建理论基础知识如构建方法、编辑工具和开发工具也都一一进行了学习以供后续茶学本体的构建。第二部分,在调查本体人工构建费时费力、专家依赖性强等不足后采用本体学习方法对茶学本体进行半自动构建。在对本体学习方法深入分析后,运用本体构建方法中的“七步法”和“骨架法”构建茶学本体,首先使用ICTCLAS分词系统将获取语料进行分词处理和词性标注,编写程序完成指定词性和停用词的删除,其次采用TF-IDF方法实现基于权重的特征词筛选来抽取茶学概念,获得候选概念集,并结合叙词表、茶叶辞典和领域专家进行术语规范和补充,然后依据关联规则挖掘方法设定支持度、置信度阈值来识别概念间关系,通过以上主要步骤获得茶学本体相应的类、属性、实例,利用本体编辑软件Prot e ge完成形式化表示,主要有类层次的确定、对象属性定义域和值域的设置、数据属性的限制等,并加入本体评价与优化步骤,由Prot ege自带HermiT推理机进行逻辑一致性检测,力证所构建茶学本体的合理性。第三部分,基于茶学本体实现知识检索方面的应用,首先阐述了传统信息检索存在的用户忠实表达难、词形匹配、词汇孤岛的局限性以及知识检索所具有的语义匹配、智能推理的优势,其次探讨了基于茶学本体知识检索关键技术的解决,包括扩展查询功能、信息资源标引功能、资源检索功能的实现,具体是运用Jena语义包进行本体的读取和解析,Ecl ipse开发工具界面的编写使得检索系统在基于关键词的检索方法中实现了同义词、上位词、关系词的语义扩展,提高了一定程度的查全率和查准率。
其他文献
探讨了用草酸钠作为基准物质标定高锰酸钾标准溶液过程中的实验条件,在国标法的基础上分析了加热时机、温度、酸度对标定结果的影响,建议国标法的标定方法改进为:采用100 m L
结合国内外云计算的发展现状及研究成果,由云计算的特点入手,介绍了云计算的关键技术:数据储存与管理技术,云安全技术与虚拟化技术,最后总结了云计算的发展状况和存在问题,并
近几年,电子商务在我国得到迅速发展,带来了巨大的快递需求,目前,快递公司的基础设施建设滞后于电子商务的发展,不能满足快速增长的快递市场需求,因此,快递企业配送中心的选
当今社会生活中对观赏鱼的饲养已经成为了一种潮流,可是目前人们在养殖过程中遇到很多问题,传统的水族箱以及传统的养殖模式已经不能满足人们目前的需要。而随着智能家居概念
上海地区十字花科蔬菜根肿病分布范围广、发病严重,而种植户防治意识缺乏,防治手段有限,造成十字花科蔬菜大面积减产甚至绝收,给农业生产造成严重损失。通过在上海地区主要的
随着国家发展,高校科学研究水平和学术水平不断提升,行政管理人员业务量也随之攀升,因此对高校行政管理人员的业务水平和综合素质总体要求提高。而高校作为以教学为主、科研
目的观察参麦注射液对大鼠脑出血后神经细胞凋亡相关基因的影响。方法采用Rosenberg法复制大鼠脑出血模型,测定脑出血后大鼠海马CA1区神经细胞病理形态结构。结果参麦注射液
调查研究是我们党的基本工作方法,党的历代领导人在我国革命、建设、改革历程中对调查研究的认识、实践以及形成的理论体系一脉相承。调查研究的质量决定了政协工作水平,新时
2013年11月16日至17日,为期两天的“中国建筑研究室成立60周年纪念暨第十届传统民居理论国际学术研讨会”在江苏南京江苏省会议中心(钟山宾馆)顺利召开。此次大会由东南大学
天然气水合物以其巨大的资源量成为能源开发的热点。在油气资源日趋紧张的形势下,合理开发天然气水合物藏,可以缓解目前社会所面临的能源危机。世界各国政府都高度重视对天然