教育资源本体构建与检索研究

来源 :课程教育研究·上 | 被引量 : 0次 | 上传用户:beanmilk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】本体是信息领域近年来受到普遍关注的一个研究方向。针对教育资源管理现状,本文阐述了本体的基本理论,提出了一种本体构建模型和检索模型。
  【关键词】本体 教育领域 本体构建 本体检索
  【课题项目】本文为山东省高等学校科技计划项目“基于本体的教育资源表示与集成研究”的成果之一,项目编号:J13LN03。
  【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2016)31-0002-02
  随信息技术的不断发展,教育信息资源数量随各教育部门信息化建设的进程不断增加,层出不穷的学习资源在给学习者提供便利的同时,也让学习者面临难于选择合适资源、资源内容不符合自身要求等问题。近年来本体(Ontology)在信息领域引起大家的重视。作为一种有效表示知识层次和语义的概念模型,本体论已被广泛应用于图书情报处理、知识管理、网络搜索、数据集成、语义Web服务等领域之中。
  一、本体理论
  在哲学概念中,本体是指对事物自身的抽象,描述的是事物的性质或其根源。在计算机界,普遍认为“Ontology是共享概念模型的明确的形式化规范说明”[1]。这个定义主要包括四个主要方面:概念模型(conceptualization)、明确(explicit)、形式化(formal)、共享(share)。
  本体的目标是获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定领域内共同认可的词汇,并从不同层次的形式化模式上给出了这些词汇(术语)和词汇间相互关系的明确定义[2]。构造本体对实现知识共享和重用、提高系统通讯和互操作、提高系统可靠性都有重要意义。
  在计算机领域,本体论包含类(class)、关系(relations)、函数(functions)、公理(axioms) 和实例(instances)5个基本的建模元素。
  本体的实现要通过本体语言进行。本体语言种类繁多,既有专用的本体语言,也用基于某种标准的本体语言。在网络资源处理中,OWL(Web Ontology Language)是W3C组织推出的标准网络本体语言。
  二、本体的构建原则
  本体的构建是一个复杂的系统化过程,目前没有一个标准的本体构建方法。本体构建原则最有影响的是Gruber(Toward Principles for the Design of Ontologies Used for Knowledge Sharing)在1995年提出的5条规则[3]。
  1.清晰(Clarity)
  本体必须明确的定义相关术语的含义。该定义必须是客观的,与其周边因素相互独立。
  2.一致(Coherence)
  本体所定义的公理及使用自然语言进行描述的文档应当一致,并支持延展的、与定义相一致的推理。
  3.可拓展性(Extendibility)
  本体应是可拓展的,以已有的定义为概念基础,可以不需对已有定义进行修改就对拓展出的新术语进行定义。
  4.编码偏好程度最小(Minimal encoding bias)
  构建本体时,对概念的描述尽可能采用通用的方法,不要依赖某一种特殊方法。
  5.本体约定最小(Minimal ontological Commitment)
  本体构建时只需考虑最基本的共享知识即可,这样可以尽可能的减少约束。
  这5条规则对本体的构建提出了基本的原则和思路,但并没有提供明确的易于操作的手段。在本体的构建中,我们要根据实际应用的需求,灵活使用这些规则,构建出高质量的符合我们要求的本体。
  三、教育领域本体构建
  本体的建设应当面向用户的需求,根据教育资源信息处理的特点,教育领域本体应该能够清晰地表示教育领域主要的概念术语、属性以及相互关系,对教育领域活动所具有的属性规律进行形式化的描述[4]。用户的学习程度、知识的更新、技术的发展等,都是本体构建时需考虑的因素。
  本文结合教育资源建设中的课程资源建设,提出一种本体构建方法,流程图如下(图1)。
  1.需求分析
  该阶段的任务是明确整项工作的目标、用途、知识范围。主要包括:本体构建的目的是什么,要针对何种应用、达到何种目标?本体针对什么样的目标人群,构建过程中涉及哪些知识领域?本体构建要采用哪种本体语言?对于课程资源建设来讲,就需考虑课程建设的最终目标、针对的学习者情况、涉及的知识点及其衍生的知识点等。
  2.确立目标任务
  该阶段对本体构建的过程进行详细规划。要根据本体构建的最终目标,结合具体的需求和资源情况,制订出详细的实施计划。需明确的内容包括本体构建的方法、参加任务的人员情况、人员的分工、任务的时间节点、各阶段需达到的目标等。
  3.本体信息采集
  该阶段需对领域相关信息进行充分的分析,相关的专业文献、书籍、网络信息、其它的本体等,都是该阶段需关注的内容。中国图书馆分类法编委会教育专业分类表编辑组编辑的《教育主题词表》是信息采集中一个重要的参考和依据。对于课程资源,需要采集各知识点,明确知识点所针对的资源及知识点的前导后继、相互关系等。
  4.确定重点概念,形成概念体系
  在信息采集的基础上,通过对知识的分析和征集专家的意见,确定该领域中的重点概念,并用精准的术语进行描述。对于课程资源中的重点知识,应按照一定的规则对它们进行划分,形成不同的知识范围,在同一范围内,在考虑前导后继、整体和部分的基础上,去除重复的和不相关的知识。
  5.利用本体语言和工具,进行可视化编码
  选择合适的本体语言工具,进行可视化编码,建立可实现检索和扩展的本体库。本体的表示语言很多,其中OWL(Web ontology Language)是语义表达能力最强的描述语言。[5]   6.本体确认与评价
  对本体进行编码描述后,还需通过测试进行本体确认和评价,包括是否满足本体构建需求、本体描述是否清晰、关系的完整性等。
  7.存储
  按照本体存储介质的不同,本体的存储方法大致分为基于内存的存储方式、纯文本存储方式、基于数据库的存储方式和专门的管理工具方式四种,其中研究最多、应用最广的就是基于数据库的存储方式。[6]课程资源建设一般采用以数据库存储为主,其它手段为辅的存储方式。
  本体构建完成后,还应按照构建需求和学科的发展,对资源库进行进一步的优化完善和后续建设。
  四、教育领域本体检索
  传统的信息检索模式是使用搜索引擎,利用关键词进行查询,检索结果的准确性不是太高。利用本体技术检索能加强用户与资源之间的语义沟通,大幅提高检索结果的准确性。
  在教育资源本体构建模型的基础上,建立教育领域本体语义信息检索模型,如图2所示。
  该模型包括用户接口、语义处理模块、数据存储模块等几项内容。
  用户接口负责实现同用户的交流,主要包括用户界面、语义查询接口、语义标注接口、服务调用接口、资源采集接口等,负责将用户的输入转换成本体相应格式,并调用语义处理模块进行处理。
  语义处理模块主要包括资源预处理、概念提取、索引、查询等,负责完成信息的收集与检索功能。该部分的效率决定了整个系统的效率。
  数据存储模块包括教育领域本体库、索引数据库、资源库,分别完成对领域知识、资源元数据和资源的存储。
  五、总结
  针对目前教育信息化建设中存在的问题,本文研究了利用本体在教育资源集成中的应用,提出了构建教育资源本体库和本体检索的模型。本体的构建是一个长期复杂的过程,不可能一蹴而就。本体技术及相关研究正在快速发展,相信随着相关技术的进步和成熟,各种基于本体的教育资源管理平台会大量出现,推动我国教育事业进一步发展。
  参考文献:
  [1]Paolo Ciancarini,A bibliograpghy on coordination.1997.
  [2]廖军. 基于领域本体的信息检索研究[D].长沙:中南大学,2007.
  [3]Gruber T. Towards Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal of Human?鄄Computer Studies,1995;43(5~6).
  [4]马捷.教育领域本体构建研究[J].情报理论与实践,2012(7):104-108.
  [5]Muller H M,Kenny E E,Sternberg P W.Textpresso:An ontology?鄄based information retrieval and extraction.
  [6]傅柱.本体存储技术研究综述[J].情报理论与实践,2013(9):118-123.
其他文献
残留物分析是生物考古的重要组成部分,长期以来一直是国际科技考古学界的热点之一,在国内处于起步阶段,但也取得了一些重要的成果。有机残留物中一般包含蛋白质、脂类、核酸或者
自1980年以来,从大学直接分配和调到我们报社做记者、编辑工作的青年同志已达83人,占全报社记者,编辑队伍总数的53.2%。几年来,我们责成编委会一位成员专门负责,采取一些具
院士制度是各国科技界通行的学术荣誉制度,是各个国家科技制度的重要组成部分。中国当代院士制度经过几十年的发展和完善,已经逐步进入制度化发展的历史时期。但是,随着历史时代
1982年在黑龙江省拉哈,以三倍体品种双丰303(2n=27)和二倍体品种双丰5号(2n=18)为杂交亲本,然后按单株收获种子。同年将这批种子在江苏省徐洲地区种植。在一定时期,田间取心
水是水稻生育过程中不可缺少的因素之一,它对水稻的作用,包括生理需水和生态需水两个方面,所谓生理需水是指直接用于水稻正常生理活动,保持叶面蒸腾和体内平衡等所需的水分,
本文对牛顿特性血液流体、非牛顿特性血液流体在人体肺动脉及其分支内的血流动力学特性进行了数值模拟,并使用有限元方法对血液与血管的流固耦合问题进行了模拟研究。本文首
本论文的核心内容是提出一种水面无人艇运动多目标系统辨识方法,并通过模型试验计算分析验证该方法的正确性。分别以横摇角速度、纵摇角速度、横向速度和回转角速度的误差函
人口南迁是历史时期的"主流"移民,它始于秦汉,终于南宋,改变了中国人口北多南少的历史.大批的人口南迁促进了南方经济的逐步发展与繁荣,长江流域经济发展赶上并超过黄河流域,
花期相遇是夺取杂交水稻制种高产的关键.为了达到花期相遇,各地在制种中都很重视父母本播种的叶片差.但是由于气候变化、土壤肥力、病虫为害,栽培措施等因素的干扰,花期往往
我国高等教育在大众化过程中最需要重视的是高等教育质量保证的问题,无论是在普通高校,还是重点高校,这一问题是不容回避的,重点高校作为我国高校的领航者,其教育质量更应受到特别