论文部分内容阅读
简牍是我国古代最早的书籍形式,由竹片或木片制成,用于记载古代的军事、文化、户籍和司法等资料。随着大量珍贵简牍文物的出土,繁重的工作量也随之而来。其中包括了对简牍的清洗及简牍信息的整理、编结。由于年代久远,简牍自身受到自然环境的侵蚀,且在发掘的过程中易断裂。若要提取简牍上完整的文字信息又需要完整的复原一整块简牍,我们把这个复原的过程称为碎片匹配拼接过程。碎片匹配拼接技术是模式识别技术的一个新拓展,目前已应用到文物复原,碎照片识别,机器零件接口等领域。本文针对简牍碎片的特点,选取了一种基于Hausdorff距离的匹配拼接技术。简牍图片在采集或传送的过程中,由于输入转换器如CCD光电藕合器件、AID转换器等性质的差别和周围环境的影响以及参数的合理选择等因素,采集到的图像可能含有各种的噪声和不同程度的失真,为了有效地进行特征提取处理,就必须消除噪声、校正失真,使输出的图像具有清晰的轮廓,以利于提取碎片的特征。文中对采集到的原始简牍图片进行了加权中值滤波,此方法弥补了普通中值滤波的不足,可以很好的滤除噪声的同时保留边缘细节信息。浮动阈值二值化方法将图像分成一些子块,对于每一个子块选定一个阈值。这种阈值方法与固定阈值二值化方法相比,能根据图像的局部灰度自动选择合适的阈值,充分考虑了图像的不均匀性,能得到最佳的二值化效果。边缘是图像最基本的特征之一,包含了用于识别的有用信息,为人们描述或识别目标以及解释图像提供了一个有价值的和重要的特征参数。文中对Roberts边缘检测算子、Sobel边缘检测算子、Prewitt边缘检测算子、Canny边缘检测器、Laplacian边缘检测算子进行了对比分析,最后选取了具有二阶微分算子的Laplacian边缘检测算子。该算子利用二阶导数零交叉所提取的边缘宽度为一个像素单位,所得到的边缘结果无需细化处理,从而保证了边缘定位精度。因含有很高的信息量来反映图像的局部特征,能够更可靠的匹配图像,角点检测技术目前已被广泛的使用。按尺度划分,从边界曲线上检测角点算法包括单尺度算法和多尺度算法。单尺度角点检测方法存在着只注重于曲线方向的剧烈变化而忽视曲线总体形状,从而使角点检测的结果中或者存在着假角点,或者忽略了重要的角点。为了克服上述缺点,选取了基于威布尔函数的多尺度角点检测方法。该方法通过威布尔函数做为平滑卷积核,选取特定的曲率公式计算边缘曲率,选用基于曲率的角点提取方法提取角点。残断简牍碎片的自动拼合是从许多散乱的残断简牍碎片中,借助于计算机,通过轮廓匹配拼接技术来识别出相互邻接的残断简牍碎片,进而重现整个完整简牍的原貌。简牍轮廓的特征段是由特征点及其邻域内的若干点构成的点集,点集中各元素的值是轮廓上该点的曲率值。通过计算特征段曲率之间的Hausdorff距离来表征它们的相似程度,Hausdorff距离值越小,说明两个特征段相似程度越高;反之,Hausdorff距离值越大,说明两个特征段相似程度越低。本算法在保证较好匹配精度的前提下,可以达到切实可行的运算速度。