论文部分内容阅读
随着互联网的不断发展,网络上出现了各种各样的应用系统,这些系统中不断产生出无数的数据记录。目前,存储数据记录最常用的模式就是关系数据库(relational database)。关系数据库系统搜索数据记录的常用方法就是通过SQL语句来搜索出满足特定条件或关系的结果。但是对普通人群来说,他们可能根本不懂什么是数据库,他们关心的往往是抽象层面表示的记录数据,如某人的姓名、年龄、工作单位等信息,他们不关心记录数据在数据库的具体存放形式。在实际应用中,一条完整的数据记录很可能分布于不同的数据库表中,即一条记录可能存储在不同的数据库表中。但是对普通用户来说,无需考虑这些细节。传统的搜索只取出数据库字段约束条件的数据记录,而且搜索出的这些记录彼此之间是无任何关联,是孤立存在的。然而在实际应用中,数据记录之间并不是孤立的,往往存在着千丝万缕的关联关系,虽然这种关联关系可能并不以字段的形式直接存储在数据库中,但是我们通过分析数据信息却又可以推导出这种隐含联系,显然这种推理是传统搜索所无法实现的。要解决上述问题,本文首先选择本体对数据记录做统一性的描述,然后根据应用需要,自定义数据库数据记录对象的抽象分类即进行记录类的构建,通过配置映射表指定记录类属性与数据库中字段的对应关系,这样用户层面的抽象数据就可以与数据库中的数据字段进行相应转换。通过解析映射表中的关联条件将分布在不同的数据库中的信息互联起来,整合成完整数据记录。同时通过关系规则来描述数据记录之间的潜在关联,并经过解析关系规则来实现关联搜索。本文的创新点主要有以下两点:第一,通过配置记录类与数据库的映射文件,可以指定数据记录与数据库字段的对应关系,从而使普通用户可以通过逻辑层面的约束条件去查询相关记录,而无需关心数据的实际存放位置及存放格式。第二,通过定义关系属性和解析关系属性包含的关系规则,推导出数据之间的潜在关系,从而实现数据的关联搜索。