基于关联规则的中文姓名识别方法

来源 :宿州学院学报 | 被引量 : 0次 | 上传用户:mujun1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从中文姓名识别技术是中文分词领域的重要分支的角度,分析了传统统计中文切词方法正确率低的缺失,表现为基于机器学习方法的中文姓名识别技术对词典规模和语料库容量依赖性大的缺陷,以至于不能够有效地发现未登录词,降低了中文姓名识别的正确率;以中文姓氏用字为线索,提出了一种改善的无监督的中文姓名识别方法,在统计法的基础上,利用关联规则算法挖掘出与姓氏相关的强规则进行姓名识别。实验结果表明:此方法对词典规模和语料库依赖性较小,能够自动消除歧义,有效地发现未登录词,提高了中文姓名识别的正确率。
其他文献
提出使用无人机进行输电线路故障排查,提高抢修恢复电网运行的安全性和快速性。为对山区、高跨等人力难以到达的部分线路杆段采用无人机巡视和检测,宿州供电公司联合南京航空航
近日,晋煤集团蓝焰煤层气公司在甘肃庆阳地区的两口试验井千米以下压裂试验获得成功,为我国千米以下煤层气的抽采利用提供了有力的技术支撑。晋煤集团是我国最大的煤层气抽采利
全球领先的涂料及油漆供应商佐敦集团近日宣布,将逐步淘汰有害化合物——铅铬在公司全球所有油漆与涂料产品中的使用,并在保证产品相同性能与效果的前提下,采用有机环保颜料
结合“卓越工程师教育培养计划”的实施,对物理化学的课堂教学和平时考察方式进行了一些改革尝试.在课堂教学中,要将教会学生熟练掌握和运用所学知识解决实际问题作为目标;平
从流浪者形象分析了阿瑟·米勒《推销员之死》中的犹太性,首先表现在剧中人物身体上的流浪和精神上的流浪,一方面在外漂泊,一方面迷失自我;对《推》剧中的父子主题进行了阐释
以生物质基合成气制低碳醇为研究对象,使用流程模拟软件Aspen建立模型,讨论醇产物分布、过程水含量、碳的转化形式和CO2减排、产焦以及工艺的质量和能量平衡,并与文献进行对比。
针对复杂的非线性系统较难建立精确的数学模型这一难题,提出一种基于模糊推理系统的(ANFIS)自适应方法方法对系统进行建模。建模过程中为了给ANFIS赋合适初始值,选用人工免疫聚
应用百宝胶囊治疗神经衰弱55例,取得满意疗效。采用1:1随机对照试验,对照药为多糖蛋白。结果显示:治疗组显效率38%,,总有效率96%;对照组显效率14%,总有效率75%。差异非常显著P<0.01。百宝胶囊治疗组对神经衰
本研究旨在探究高职旅游类专业英语的教学改革,探讨在ESP(专门用途英语)框架下的旅游类专业英语改革方案的可行性,以期培养“外语+专业知识”的复合型旅游人才。依据ESP教学理论,分
解释了高聚物包装材料固体之间发生接触和分离过程时发生静电起电现象的机理;探讨了摩擦在高聚物起电中的作用;详细讲解了剥离起电、破裂起电、压电起电、感应起电和吸附起电