基于BIRCH和改进k中心点算法的古籍汉字图像聚类研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:zjtiankong1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字是记录中华五千年文明的重要方式,研究古籍汉字对研究中华文明有着重要的意义。古籍汉字数量大、笔画多变、结构复杂、相似字多、区分困难,对古籍汉字进行适当的电子化并进行分类整理将会给古籍汉字研究带来很大的便利。本文针对古籍汉字图像本身的特点,通过提取图像组合特征,设计了一种基于BIRCH与改进的k中心点聚类算法的古籍汉字图像聚类方法。本文首先针对古籍纸张与印刷质量差异较大、汉字粘连、下划线较多等情况,对古籍汉字图像进行必要的预处理,以便于古籍汉字图像特征的提取;然后利用网格结构,提取古籍汉字图像四个方向的粗外围特征和横、竖、撇、捺四个方向的方向线素特征,用两种特征的组合来作为古籍汉字图像的聚类特征;通过对k中心点法进行改进,设计了一种基于BIRCH与改进的k中心点算法的古籍汉字图像聚类方法。通过实验证明了该古籍汉字图像聚类算法的有效性。
其他文献
全键盘手机作为手机行业一个重要的发展方向,深得商务人士的青睐。BREW是美国高通公司推出的具有开放式体系结构的解决方案,是专门为无线设备设计的一个高效的应用程序执行环境
随着计算机技术的普及和数字化校园的发展,全国各地中小学都积累了大量的教育资源,包括精品课件,视频教程,实验报告等等。但是,不同的学校以自己的方式对这些资源进行管理,学校间的
移动Ad hoc网络(Mobile Ad hoc Networks, MANETs)凭借其无需底层固定设施即可方便部署的特性在最近数十年中受到持续关注。同时,由于拓扑动态性以及资源受限等因素的存在,路由
随着数字图像技术的发展,图像检索已经成为一个研究热点,从传统的基于关键字的图像检索发展到现在广为应用的基于内容的图像检索。基于内容的图像检索主要以图像的底层视觉内容
随着计算机网络和通信技术的发展和广泛应用,数字媒体(电子书、音视频、图片及软件等)成为当前各种网络传播内容的主流。数字内容极易于传输和复制的特性,以及到现在为止大部分网
随着互联网的兴起和智能手机的流行,市场上已经有数以百万计的移动App可以安装在用户手机上并为其提供服务。用户通过应用商店下载、使用这些App,同时在应用商店中以评论的方
支持向量机和粗糙集理论是当今人工智能和机器学习领域的研究热点。支持向量机以结构风险最小化原则为分类准则,利用靠近分类边界的支持向量构造最优分类超平面。对分类训练有
随着网络规模的日益增大,网络资源的急速膨胀,用户对数据的安全性要求越来越高,这使得海量信息网络中文档的安全问题面临着巨大的挑战。传统的防扩散技术已经满足不了现在文档遇
随着互联网的发展,各种网络业务对网络传输信息能力提出了越来越高的要求。如何高效、可靠的传输信息成为了当今的重要研究课题,而路由选择是其中的关键。仿生算法的迅速发展
无线局域网WLAN允许用户从不能访问有线局域网的地方进行联网,使网络用户能够更加自由地使用网络,尤其是在旧建筑中,其安装或更新电缆线路的费用高得惊人。使用便携式计算机及装