论文部分内容阅读
古籍汉字数量巨大、结构复杂多变,且存在大量的相似字,使用传统的图像检索方法对古籍汉字图像进行检索效果并不理想。本文通过对古籍汉字图像的结构特征进行分析和总结,设计了一种针对古籍汉字特点的、基于不规则自适应局部检索区域的图像检索算法,提取具有相同汉字部件的古籍汉字图像。本方法基于用户需求,首先由用户在汉字图像上手动划定需要被检索汉字部件的不规则局部区域,在这个过程中,用户不仅初步确定了待检索汉字部件的范围,还确定了汉字部件在整个汉字中的位置;然后根据汉字部件的连通性对用户选定的局部检索区域进行自适应性的腐蚀和扩展,以解决用户在选择局部区域过程中可能产生的噪声和残缺问题;最后,根据图像局部检索区域内笔画密度特征间的欧式距离进行匹配操作,得到用户所需要的包含同一部件的古籍汉字图像。实验表明,该方法作为辅助工具,有助于提高古籍汉字的研究效率。