论文部分内容阅读
关联数据的概念于2006年被提出。用关联数据技术发布数据信息,是实现数据万维网最重要的一步。W3C组织公布的资源描述框架和Web本体语言对文档中出现的概念和概念间的关系做了形式化的定义,使得网络数据具有了全球通用性和机器可读性的特点。关联数据的最主要作用是关联创建和数据整合。同时,关联数据技术对电子学习系统也提供了富有语义的知识服务。关联课程数据的构建、组织以及知识管理是未来电子学习领域的重要研究方向。本文从数据转换、关联课程数据构建、知识本体构建、关联数据存储索引等方面展开研究。(1)在数据转换方面,提出了将多种类型的教学资源文档转换为RDF数据的方法,其中创新提出一种表格数据转换成关联数据的方法,本章提出一种表格文档转换成关联数据的方法,利用LOD数据集的语义关系,生成表中的列题、表元值、列与列之间关系的相关候选类和实体,然后进行关联推断,以马尔科夫网络图模型为框架,计算相应的因子节点的值,从候选集中选取最佳的类和实体,分配给表格中的列题和表元,最后将其转换成RDF数据,并和各经典数据集相关联。(2)针对知识表示的问题,提出了关联课程数据构建方法,其中以计算机微机接口,组成原理等课程为例,构建计算机硬件课程RDF数据集。然后引入了知识本体的概念,介绍了本体的定义及本体的构建方法,知识本体的元数据以及知识点的认知顺序,在此基础上构建前序后续知识点之间的关联,是系统实现知识发现和知识导航的基础,同时提供了更为复杂的检索功能。由于自然语言和概念表述的多样性,知识点之间存在非前序后续关系或非映射的关联,本文提出一种新的基于内置文本匹配的关联方法,将自然语言中相互关联,却无法用机器进行推断的相关知识点,存放在文本匹配表中,通过行表元的信息读取,构建它们之间的关联,为关联课程数据增添更多语义联接,有助于学习者更全面的掌握课程领域知识,提高学习效率。(3)针对关联数据存储和索引的问题,分析目前采用的主要的语义数据存储方式,分析其利弊,提出一个基于垂直划分、多索引及属性表的混合存储结构,提高存储和查询功能。同时,基于权威数据集的实验证明了本文算法研究的有效性,实验结果表明本文对于课程关联数据的转换、存储方面所做的深入研究和提出的实现方案是具有创新性,并且是可行和有效的。