汉文古籍标准化元数据转换研究与应用

被引量 : 0次 | 上传用户:wangyanling100wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的古籍普查方式耗费大量的人力物力,主要采取中国机读目录格式CNMARC(China Machine-Readable Catalogue)、古籍普查表、国家珍贵古籍名录申报书和Access数据库等传统载体进行记录。由于各地图书馆的条件差异和数据标准不一,即便是同样内容的数据,存储格式也不尽相同。加之这些传统载体本身的粗粒度,不同格式文件的交流困难,造成古籍数据的传播、查看、统计和检索十分不便。本文主要研究了汉文古籍标准化元数据转换问题,进行问题分析,设计和实现了标准化元数据转换的软件工具,并对软件工具进行详细测试,并对汉文古籍数字化工作的发展前景进行展望。本文通过古籍数字化服务平台,应用Web技术,实现了在线汉文古籍标准化元数据转换。通过古籍元数据建模,采用面向对象的设计思想,利用关系数据库进行存储数据,把古籍数据设计成为了细粒度的元数据。通过对CNMARC数据进行格式解析,将国家图书馆的38万条CNMARC格式数据转换为古籍数字化元数据;通过使用POI技术对Excel、Word等文件进行解析,将2500条古籍普查表数据和100条国家珍贵古籍名录申报书数据也转换为古籍数字化元数据;通过JDBC(Java Data Base Connectivity)连接数据库,将1800条Access数据也转换为古籍数字化元数据。此外,在古籍元数据模型的基础上,使用Lucene对30万条古籍数据建立索引,用于数据检索,平均检索时间在1秒以内;通过计算机统计与编排,实现了古籍信息自动编目及PDF输出。通过本文的一系列研究工作,我们将汉文古籍数据转换为了统一格式的细粒度元数据,展现形式更加易于多样化,统计十分便利;Web技术的应用,减少了古籍普查所需的大量资源成本,古籍传播和查看十分方便;采用了成熟的索引技术,古籍检索速度快捷,满足了实际应用需求。
其他文献
过去式仿机洋机不懂“中国心”业内人都知道,在水电安装和家装行业中,最令人头痛也最耗时的一道工序就是墙壁开槽了。传统的手工开槽不但效率极低,还严重阻碍了整个工程的进
依据临洮气象局近3年提供的气象资料,对马铃薯晚疫病传播途径、危害症状、发病规律进行了分析研究,发现气温适宜、阴雨天多、日照时数少及田间空气湿度大是马铃薯晚疫病发生
进入高级阶段的汉语教育不同于其他阶段的留学生教育,除了关于各项语言技能的课程,还开设了文化课程,尤其是进入学历教育阶段后,为留学生开设了各类汉语言专业课程,中国文学
异体字是汉字中十分重要的部分。甲骨文作为我国现存最早的成系统文字,对甲骨文异体字进行研究,有助于了解异体字最初的整体面貌,有助于对甲骨文系统进行整体研究。本文对甲
以满足客户服务需求作为研究的立足点,对服务响应型物流的运作模式做了深层的分析,研究表明提供服务物流企业只有为顾客提供及时、满意的柔性服务,才能从根本上提高企业自身的服
一次成型颠覆传统墙面开槽方式传统的墙体开槽从原始的手工凿式开槽,到使用切割锯先割出两条线缝后,再用电锤凿出线槽,这两种开槽方式都是操作复杂,工作效率低,对墙体的损坏
<正> 近几年内,刑事犯罪居高不下,一直是困扰社会治安的一大难题。特别是重新犯罪率的持续上升,不仅增多了刑事案发,而且增多了重、特大刑事案发。基于此类案犯较深的主观恶
汉语中连词作为虚词的重要组成部分,在段落篇章中起重要的衔接作用。汉语连词数量较多,用法比较复杂,是对外汉语教学中的重点和难点之一。目前对于外国留学生连词学习的研究
<正>土地革命战争时期,创办于赤色首都瑞金的苏维埃大学,堪称今天中华人民共和国国家行政学院的前身,并且形成了国家行政学院的雏型。两者的法定地位相等苏维埃大学是根据中
对比新旧加油站设计规范部分条文并运用于实践。