基于多级阈值的中文人名识别

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:sunrainnet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对大规模姓名样本库统计的基础上,研究了各种中文人名的姓氏、名字用字规律,并通过对大规模语料库的统计分析,得到了每个姓氏用字在真实文本中用作真实姓氏的概率及其上下文规律;针对汉族人名和少数民族人名及音译人名,分别提出了多级姓氏阁值和多级首字阈值的概念,并使用3σ法则确定阈值。实验结果表明,基于多级阈值的中文人名识别模型是有效的。
其他文献
介绍了微波技术在药物生产、分析及合成方面的应用和最新研究进展;揭示了微波作为一种优良的热源和催化手段在药物合成反应中的重要作用。
文章系统地总结分析了小秦岭-熊耳山地区金矿的成矿流体特征和成矿作用及矿床的S、Pb、O、C等稳定同位素特征,提出金矿床的成矿流体为地幔流体.流体的运移方向则是自南向北,
瑜伽呼吸不是人们日常生活中那种无意识和随意式的呼吸,而是有意识的主动式呼吸,通过合理调整和控制呼吸,使肺脏发生有节律的收缩,促进体内的血液循环和新陈代谢。从瑜伽呼吸
高校学生干部队伍建设是大学生思想政治教育工作中非常重要的一个环节。面对新形势下“九零后”的高校学生干部群体,我们要另辟蹊径,以团体心理辅导技术和社会工作利他主义为
目的:观察鼻出血患者的常见部位和治疗方法。方法:回顾性分析172例鼻出血患者的出血部位,根据不同出血部位,选择不同的止血方法。结果:小于30岁的鼻出血患者占12.20%,30~50岁占3
为了解决多级阈值化技术中所选阈值的数量通常不能预先确定的问题,提出一种基于Mean Shift聚类技术的新型多级阈值化方法.首先,通过使用Mean Shift技术探寻出潜在的模式中心,
国民经济的发展,对电力的需求也在持续性增长。为解决东部电力紧缺情况,将西部多余电力输送东部。在电厂生产出电力被送往电网中,还需经过电网的变电站,最终才能够经过变电站
<正>劳模往往比一般的劳动者更具社会远见、洞识,特别是在一些很前沿的科技工作岗位上,他们甚至就是那些最具世界视角,且有能力又敢于在自己的岗位上"为人先"的人。每年我们
基于知网收录的政治学期刊文献,通过对政治学重要观念的变化趋势分析,本文旨在从观念史角度反映政治学研究的变化,试图阐释政治学与政治的关系。在文献年代分布梳理的基础上,
<正>中兴事件虽然让我们痛彻心扉,但也有三大好处。第一,让我们冷静,坚持自主发展核心技术,放弃少林扫地僧一朝发功的神话。任何扫地僧的出现,背后一定是几十年的酝酿,这是常
期刊