基于关系形式概念的教育资源语义模型研究

被引量 : 2次 | 上传用户:diaolan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着国家信息化战略的深入推进以及数字化教育的持续发展,我国各级教育资源建设已经取得了巨大的成就。Web上各类教育资源的存量巨大、内容丰富、增长迅速,特别是随着“互联网+”思维在社会生活中的深入应用实践,众多辅助的学习模式和手段在技术变革中也在悄然演变和进步,终端学习者对资源的获取、贡献与影响会越来越直接,由此必将进一步推动教育资源的建设共享规模以及强化其发展质量,所有这些对教育资源的有效组织与获取技术提出了更高的要求。而同时,巨量的教育资源处在开放、动态和多变的Internet环境下,位置分散、内容多样、实际描述标准不统一,针对特定学习目的,学习者往往较难实现有效的资源内容筛选与获取。如何利用文本信息技术实现资源语义层面的自动标识,关联整合不同组织、不同形式的教育资源数据,实现更为有效的教育资源组织和共享具有十分重要的理论和实用价值。为此,论文提出了基于关系形式概念(Relational Formal Concept, RFC)的教育资源语义互联模型——资源关联语义链网络(Resource ’Association Link Network,RALN),主要聚焦于三个关键研究问题:(1)针对开放的Web教育资源标识组织,如何引入更多的背景知识,提高资源模型的通用性与适应性,论文需要为背景知识的表达与获取提供灵活、通用的语义框架支持;(2)为了改善文本主题单纯依靠离散关键词统计特征的局限,使其获取与人类的并行阅读方式更为接近,论文在获取局部词条概念的同时,还需获取资源片段的上下文语境特征,更好发挥背景知识的效用;(3)针对个性化资源的时空动态性,如对于不同学习者和不同学习阶段,资源间的关联都可能存在差异或变化,资源模型在表达资源内容静态关联的同时,还应该具备动态学习能力,为教育资源语义标识、关联组织提供动态模型支持。论文针对以上问题进行了研究,主要内容为:(1)扩展了传统形式背景(Formal Context, FC),构建了关系形式概念模型(Relational Formal Concept Model, RFCM)。基于三元组关系构建的 RFCM,为实体词条(包括主体概念、客体概念)、实体关系(谓词概念)的语义描述提供了统一的形式化框架,即关系表达成主、客体概念、谓词概念。其中主、客体概念、谓词概念是关系不同侧面语义的集合二元组形式化体现,均由概念的内涵和外延两部分组成。论文基于关系形式概念模型,借助开放协作知识库(如百度百科、维基百科),自动获取其中的条目数据、标签数据作为关系形式背景的初始来源,以此构建关系形式概念背景知识;在关系形式概念提供的初始背景知识下,综合考虑词条上下文句法信息,本文采用图理论对实体词条间的关系形式概念连通度进行计算,实现实体关系的抽取、实体概念识别的协作处理,辅助关系形式背景的扩展学习,为资源标识提供动态的背景知识。关系形式概念模型作为一种协作、自组织的文本语义获取与表达模型,能为后续资源文本的主题抽取与表达、Web资源关联组织,提供更为灵活的形式化背景知识和统一的语义框架。(2)基于关系形式概念模型,为文本主题的定义与获取设计了完整的技术路线,构建了关系形式概念主题模型(Relational Formal Concept Topic Model,RFCTM)。RFCTM借助了关系形式概念背景知识,首先对实体词条的关系形式概念相关度进行计算;并综合考虑词条上下文句法信息,进行文本中关系形式概念的连通度语义计算,实现了从文本原始词条—词条主题—文本离散主题—文本连通主题的资源主题获取路径。相比离散关键词的主题表达,RFCTM具有关系形式概念更为灵活的语义表达粒度和更为完整的主题表达框架。现代系统科学认为[3]:新事物的性质以既有组成要素为基础,但又不能由组成要素完全说明,组成要素之间的特定内在联系才是事物的本质。该观点用以文本主题的分析同样适合,即词条是语义的基础,但离散词条及其概念也难以完全刻画文本语义主题。RFCTM则模拟了人的基于局部特征和基于语境的并行阅读认知方式,可以为基于内容的Web资源标识提供形式化的主题向量,为资源的关联组织提供基础的语义要素。(3)以文本主题模型为基础,为教育资源的标识与组织构建了基于语义的标识模型。该模型包括知识关联语义链网络(Knowledge Association Link Network,KALN)以及资源关联语义链网络(Resource Association Link Network, RALN)。KALN是由关系形式概念及其连接关系构建的知识网络,它为资源标识组织提供了基础的背景知识网络;RALN表达了资源文本片段间的语义关联关系。论文以资源片段的语义作为独立的主题模式,它也是RALN进行关联的逻辑结点,并对雷同的主题模式约简合并,以此减少在资源标识过程中的RALN结点增加速度,控制RALN的规模,提高资源的标识组织效率。由于KALN、RALN是由通用的开放协作知识库初始化的,针对特定的教育资源标识组织往往语义粒度过粗或缺少领域知识的支持,难以反映领域资源间特定关联或领域背景,需结合领域资源的内容作进一步扩展。(4)借助神经网络结构理论中的四个相关假设,对KALN进行了连接强度的计算扩展。论文模拟人类记忆的激活扩散、遗忘抑制机制,借助资源内容对关系形式概念的关联强度进行动态学习调整,使其不仅反映关系形式概念语义关联,还体现Web资源中关系形式概念的领域共现语义,使知识关联语义链网络与特定领域背景更为接近。论文还提出了基于资源文档的结构信息对RALN进行扩展的思路,使主题模式之间的关联不仅体现其包含的关系形式概念细粒度语义关联,也体现资源同一文档中的多主题模式间粗粒度领域关联。最后还对KALN与RALN增量更新算法进行了优化,提高模型的扩展学习效率。针对当前资源标识组织存在的问题,论文的创新性工作主要体现在:(1)扩展了形式背景(Formal Context, FC),定义了关系形式概念模型(Relational Formal Concept Model,RFCM),从形式上统一了词条、关联和概念间的语义表达,为文本主题的表达提供了 一个新思路;(2)基于关系形式概念的连通度概念,进行文本词条的连通度计算,为文本主题的获取提供了更多语境信息;(3)借鉴激活扩散、遗忘抑制的记忆认知规律,构建并扩展了资源关联语义链网络,为个性化学习与资源推荐提供了动态的模型适应能力。
其他文献
目的PBL是“以问题为中心的教学法”,它在医学硕士研究生(以下简称“研究生”)教学中的应用尚处起步阶段,本研究通过对某医学院校开设的研究生PBL课程进行教学质量评价,探讨P
对玉米酸奶的加工工艺进行探讨,确定了较为合适的工艺条件,并针对玉米桨杀菌时容易分层现象,选择调节pH值的方法,成功地解决了这一问题。
新中国成立以来,青少年体育政策不断发展,但也存在权责主体不明确,监督、评估、激励体系不完善等局限性。发展青少年体育,应加大宣传力度,推广青少年体育活动,建立有效的青少
目的探讨坎地沙坦对血管紧张素Ⅱ(AngⅡ)诱导的血管平滑肌细胞增殖和迁移及对连接子蛋白43(Cx43)的影响和机制。方法体外培养A7r5大鼠胸主动脉平滑肌细胞,随机分为对照组、 AngⅡ
梁开发主任中医师为四川省名中医,从事中医临床40余年,学验俱丰,辨治灵活,本文举其以补火(肾)生土开胃,滋肾营脾开胃治验胃痞病二则,予以分析讨论,示其整体观念与圆机活法的
随着文化创意产业的浪潮风靡全球,我国也逐渐开始探索符合自身的文化创意产品发展之路。各地区纷纷依靠各自丰富文化资源来树立形象、传播文化、发展经济。沈阳故宫是沈阳地
以互联网为核心的信息革命极大地改变着人类传统的生活方式、思维方式和行为方式。随着网络软、硬件技术不断升级换代,网民人数也急剧增加,据中国互联网络中心统计报告显示,1
浅析农村家电市场的营销策略周健当生产企业和商家正在为城里的“家电大战”和日益增多的家电产品库存而采取不惜血本的降价风潮时,消费者却仍然无动于衷。厂家和商家开始意识
目的探讨艾滋病感染孕妇分娩期的临床护理措施。方法选取本院于2007年1月至2012年12月收治的艾滋病孕妇28例为研究对象,随机将孕妇分为观察组及对照组,每组各14例。对照组患
柳永是北宋时期的一位重要词人。他的重要性表现在对唐五代词的多重拓展上,从写作形式上的创新声、富于铺陈,到书写内容上的题材之拓展、口吻之转变,再到传达意境上之抒情主