论文部分内容阅读
古籍数字化并不能免去文本保存的负担,其所带来的重要变化在于古籍的使用上。全文检索是古籍数字化中最受重视的技术之一,但简单的字符串匹配“噪音”太大,需要对文本进行标注和索引。XML的可扩展性和易交换性使其成为首选的标记语言。主要讨论如何在计算机中存储与检索这些经过XML标注的古籍文本.也就是建立XML数据库。一个基本做法是在目前占统治地位的关系型数据库上增加XML映射层.使之能适应XML数据的存储和查询需要。在关系数据库中引入XML技术可以提高其自身的灵活性,而其成熟的管理机制也可强化了XML数据库的体质。