一种基于可信度的人名识别方法

来源 :中文信息学报 | 被引量 : 51次 | 上传用户:zxqzxm88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专名识别技术是影响中文自动分词精度的一个重要方面,也是自动分词技术的难点之一。本文以人名识别为例,分析了目前流行的基于语料库和统计语言模型的专名识别方法中在概率估值问题上存在的弊端;同时在规则和统计相结合的基础上,提出了一种基于可信度的人名识别方法,并给出了一个渐进式模型训练方法,克服了人工标注语料库规模的限制。从我们对《人民日报》1998年1月、2 0 0 0年12月(共约379万字)语料的测试结果来看,基于可信度的人名识别方法比传统的概率估值方法识别效果有一定的提高。
其他文献
密文数据库是增强数据库系统安全性的有效技术途径.介绍网络密文数据库的研究现状和基于服务器的数据库MYSQL所具有的特点,针对采用MYSQL所设计的网络密文数据库,在加密算法
在线考试系统的设计与实现中,组卷功能的实现是该系统需要解决的关键问题之一.论述如何应用科学的组卷策略和转换算法实现考试系统的自动组卷,从而使系统具有较高的效率、实
<正>财政部和国家税务总局先后出台一系列支农新政,通过定向税收减免和专项补贴加大对农村金融的支持力度,引导信贷资金和社会资金投向农村,有效调动了村镇银行支农服务积极
一季度能源供求增速明显放缓,价格大幅回落(一)能源生产增速大幅回落今年1-3月,国内能源生产总量57182.1万吨标准煤,同比增长6.8%,增速比上年同期回落6.6个百分点。在主要能源
通过对使用AutoCAD制图目的和良好制图习惯的论述,阐释了制图中绘图环境与格式设置的重要性及具体操作方法.
嗜血细胞综合征(HPS)亦称噬血细胞性淋巴组织细胞增生症(HLH),1979年首先由Risdull等报告,近年来有增多趋势,现将我科2000年以来收治的5例报告如下.
实施“走出去”战略,在更大范围、更广领域和更高层次上参与国际资源配置,是中国企业加快自身发展、不断做强做大的迫切要求,也是中国企业走向世界、在经济全球化中发挥更大作用
以往的教育实习,基本上安排在教学计划中的最后两个月进行.通过这种一次性的实习,很难真正提高学生的教育教学能力.因此对教育实习进行探索:将学生教学意识的培养和教学技能的
2010年11月5日,中国第一家设计基金会——北京光华设计发展基金会在京成立。北京光华设计发展基金会名誉理事长、中国工程院常务副院长潘云鹤、国务院参事室参事石定寰等相关
颅内蛛网膜囊肿(IAC)系脑脊液样的液体被蛛网膜包围所构成的袋状结构,发病率为颅内占位性病变的0.4%~1.O%[1].我院自1995年1月至2001年7月期间共收治35例颅内蛛网膜囊肿,现总