论文部分内容阅读
中国古典文学数位化发展迅速,大陆、台湾、香港及国外无论是在理论上还是在技术上都涌现了一大批相关成果。现今,大多数成果为数字化产品,停留在信息检索方便上,多采用半结构化数据库;而数据化产品则是把数字化文献当作"数据"来深挖其潜在的各种价值,一般用结构化数据库进行开发。目前中国古典文学在数位化进程中仍存在OCR识别困难(由字库不完善、不规范、不统一造成)、数位人文成果无法相互兼容等问题,古籍标点、笺注、校勘等方面也仍是难点。