论文部分内容阅读
林业领域的科研项目具有持续性、系统性、原始性和公益性等特点。该类项目的历史科研项目成果整编工作的本质目标是将通过考察、观测、探测、监测、调查、试验、实验以及编撰等方式获取到的科研数据、图集、典志、标本和样品等经过系统化、规范化的集成,达到共享利用,支撑科技发展。过去绝大部分已结题的林业项目数据资料由于没有得到有效的集成、整编与挖掘,有些数据资料在结题后就没有再发挥作用,不利于林业科技事业的发展。目前,林业领域已经对其所涵盖的一些对象进行了分类和标识。但是这些标识适用范围小,不能够很好的实现林业科技成果与全国共享数据体系的融合,其规范化程度、互操作能力以及标识唯一性、扩展性和便捷访问性都存在较大局限。为了处理林业科技成果标识局限性这一问题,需要为其建立新的标识体系。国际上常用的标识技术有数字对象标识符、对象标识符、电子产品代码等。电子产品代码(Electronic Product Code)对格式、长度要求严格,而且兼容性和可扩展性差。数字对象标识符(Digital Object Identifier)标识技术主要应用在出版领域,存在着知识产权的问题并且容易产生信息安全隐患。对象标识符(Object Identifier)与其他标识机制比较起来,具有明显的特征:结构上以分层的形式建立、可灵活兼容现有标识体系、容易扩展,可以在元数据标识和多种对象标识中使用。基于对象标识符的物联网统一标识体系可灵活的与现有的林业领域标识兼容,为林业领域奠定统一标识基础,所以可以作为林业领域的标识编码技术使用。本文引入OID(对象标识符,Object Identifer)技术建立了林业科技成果的标识与解析机制,提出了一种新的科学数据共享交换方法,建立了林业领域的标识体系。进而具体到为每条记录、每份文档和每张图片建立唯一对象标识符。为林业科技成果建立了分层灵活、可扩展性强、不定长的标识,使其能够兼容现有的各种编码机制的同时还具备自主可控性,适于国家和各行业应用的统一管理。有效落实了林业基础性工作数据进一步集成共享,为科技创新提供坚实基础的地位。对于标识后的林业科技成果管理来说。面对日益增长的林业科技成果,传统的数据库管理系统扩展能力差。对硬件设备的要求高,且价格昂贵,数据管理安全性低。为了解决管理系统的扩展性这一问题,本研究中使用Hadoop技术来设计并实现标识后的林业科技成果管理系统。针对标识后的林业科技成果,本文基于Hadoop技术实现了林业科技成果管理原型系统。并且针对林业历史科技成果进行OID统一编码。将其中的非结构化数据存储于HDFS当中,将元数据和结构化数据存储于HBase数据库中。以这种方式来保存数据,为数据的保存提供了副本机制,当发现有损坏的数据时,可以及时的自动修复损坏的数据,保证了数据的可靠性以及存储的灵活性。最后对设计的林业科技成果管理原型系统功能进行了测试。结果表明,该系统基于Hadoop技术实现了Web端的数据上传、下载,数据编辑,数据展示,数据查询功能。