论文部分内容阅读
中国科学院科学数据库系统现有的化学化工数据子库包括工程化学数据库、化学专业数据库和应用化学数据库,分别由过程工程研究所、上海有机化学研究所、长春应用化学研究所维护管理,并独立提供以检索为主的数据服务,用户如果想获得一种化合物多方面的数据,需要在不同专业数据库之间跳转。因此,构建具有统一框架的数据平台,实现中国科学院化学化工领域数据子库的整合,就显得十分必要。
本文通过设计与实施化学主题数据库,来解决中国科学院化学化工数据资源集成程度低的问题。通过对比分析,本文选择联邦数据库集成模式作为化学主题数据库的整合方法,并针对中国科学院化学化工领域数据子库的特征,在传统的联邦数据库集成模式上增加数据集成模型作为扩展,以便将上述数据资源组织起来,构成一个基于化合物唯一标识的相互联系的数据集合。
本文设计了以学科分类为根节点和以化合物为根节点两种不同的模型,通过比较,发现以化合物为根节点的概念树模型(数据集成模型)能够明显简化数据库用户的检索步骤,有利于化学化工数据库的集成与表达。
在用户接口方面,本文着重设计了基于概念树模型的统一检索入口和可视化用户界面,前者解决了用户在不同的专业数据库之间跳转的问题,后者将来自不同数据源的检索结果按照集成模型的设计分层级分节点的展示给用户。
采用不同检索方式对化学主题数据库进行验证,结果表明化学主题数据库能够实现分布异构的化学化工数据资源基于化合物唯一标识的整合,同时,能够简化用户检索步骤、节省用户时间。