基于规则和语料库的中文姓名识别研究

来源 :计算机与信息技术 | 被引量 : 1次 | 上传用户:shauto29
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文姓名识别是中文分词中未登录词识别的一个重要部分,处理好中文姓名问题势必会有效地提高未登录词识别的精度。本文提出了一种基于规则和语料库的中文姓名识别方法,兼顾召回率和准确率,针对1998人民日报语料库(共计58634个汉字,其中姓名357个)进行实验,召回率为85.1%,准确率为89.2%。
其他文献
笔迹鉴别在模式识别的发展和应用中都有着重要的意义。运用非负矩阵分解算法(NMF)对中文单字提取笔迹特征,并利用训练样本和测试样本之间角度的相关性和K近邻算法对笔迹进行分类。结果表明,NMF算法其分类正确率明显高于主分量分析(PCA)方法。这说明了NMF算法在手写笔迹鉴别分析中的潜力。
期刊
在大数据量条件下,实时动态显示三维曲面较困难,其关键在于提高三维图形数据处理和图形绘制速度。通过对基于图形工业标准OpenGL实现三维曲面动态显示的原理和方法的讨论,提出采用OpenGL的双缓存、显示列表技术,大幅度提高了图形数据处理和刷新速度,保证了每帧数据图形绘制的连续性和完整性,成功实现了三维曲面数据场实时动态显示。
期刊
提出了一种改进的SUSAN角点检测算法,在原有的SUSAN算子的基础上,针对原算子需要人为的提供阈值的不便,提出了一种自动阈值的检测方法。同时,在角点检测完成后,根据角点的形状特点,进一步的对角点进行了判断,提高了角点的识别效果。
期刊
提出了图象最佳多值分割的概念,通过构造Lebesgue测度的模板匹配公式,提出了最佳多阈值分割与图像直方图的映射关系,进而设计了与模板匹配等价的基于直方图的分割算法,该方法的计算时间不受图像大小影响,实验结果表明,该方法有很好分割效果。
期刊
将数字图象处理技术引入条码分析中,实现了一维条码的快速识别。在研究过程中,使用了条码扫描仪的光电设备采集信号,通过计算机并口实现高速的数据传输,对条码的数字图象进行处理,包括滤波降噪、边界检测、阀值分割等方法,最后通过逻辑值匹配的算法完成译码工作,实现了软件译码。
期刊
对现有游戏引擎开发技术进行改进,提出了一种有效的2D游戏引擎设计与实现方法,该方法以引擎架构为基础,以累积渲染技术作为主要渲染加速手段;结合精灵与动画技术进行具体实现,达到游戏引擎设计的目的。最后通过该方法实现了一个2D游戏引擎,并用实验验证了该方法的有效性。
期刊
细节层次模型是指对同一个场景或场景中的物体,使用具有不同细节的描述方法得到一组模型,供绘制时选择使用,本文结合DEM均匀网格模型,建立了多层次LOD数据模型,有效地简化了地形模型的绘制,提高了生成效率,使得生成的三维地形有较高的可视性和真实感。
期刊
在战斗机的虚拟现实三维造型中,驾驶舱较机体其他部分相对复杂。根据真实情况,具有高不规则、透明等特点。本文讨论了VRML下,利用Coordinate、IndexedFaceSet等节点构造战斗机驾驶舱三维空间模型的方法,并给出了该方法的设计效果验证。
期刊
基于数学形态变换理论与方法,针对低信噪比的小目标、点目标图像,通过膨胀、腐蚀、开、闭等基本形态变换及其组合变换,实现低信噪比的图像的滤波,去除噪声;提取信号峰值,实现微弱信号的放大和增强,提高图像的识别特征。理论分析和试验结果表明该算法对低信噪比的荧光图像有很强的适应性,可用于生物医学荧光图像的处理。
期刊
Delaunay三角网作为一种主要的数字地形模型表示法,经过二十多年来的研究,它的生成算法已趋于成熟。本文在简单回顾和评价了分割—归并法、逐点插入法、三角网生长法等三类主流算法的基础上,介绍并实现了一个融以上算法优点于一体,兼顾空间与时间性能的合成算法。
期刊