基于混合统计模型的汉语命名实体识别方法

来源 :计算机工程与科学 | 被引量 : 59次 | 上传用户:liongliong602
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对三种重要的命名实体,即人名、地名、组织名,提出了一种隐马尔可夫模型(HMM)和最大熵模型(ME)相结合的汉语命名实体识别的方法。该方法的特点在于使命名实体识别和词性标注两个任务一体化;融合两种统计模型进行命名实体识别,其中HMM从整体上(句子范围内)对命名实体识别进行约束,ME则在局部范围内(当前词的上下文范围)估计一个词串被标记为某种命名实体的概率。实验表明,这种方法能较好地识别上述三种命名实体。
其他文献
编者按:2017年6月6日,市委、市政府召开全市人才工作会议,颁布梅州市人才新政“20条”——《关于加快人才发展的意见》(以下简称人才新政“20条”或《意见》)。日前,市人才办相关负
报纸
以辽宁沿海港口群—东北腹地为研究对象,在Huff模型基础上,综合考虑港城引力、时间成本因素,分别利用实际最短时间距离和加权时间距离,探究港口群腹地的范围划分问题,并在此
随着并行计算机系统规模的不断增大,系统的失效率呈线性增长.如何保证大规模并行系统能够提供持续不断的服务,即提高系统的可用性,达到高可用的目标,已成为并行系统设计的重
国家环保总局近日发布了2005年1月地表水水质报告。水系总体水质基本稳定,珠江、长江水质较好,黄河、松花江水质较差,海河、辽河、淮河污染严重。
本文介绍了在财产保险行业建立防灾减损决策支持系统的内容和意义 ,以及该系统的结构和特点 ,同时介绍了如何运用遥感、地理信息系统和全球定位系统等空间信息技术来实现财产保单灾害发生前损失的预测、防灾减损方案的决策以及灾后损失的评估等决策支持。
方言是语言的一种地域变体,承载着一定的地域文化。夏县婚俗词展现了夏县地区特有的婚俗文化,在对夏县农村结婚仪礼走访调查的基础上,以婚俗词为切入点,分析夏县的婚俗理念和
本文就当前计算机科学与技术一级学科本科教学中计算机应用课程设置问题进行了探讨和研究,在分析国内外著名高等学校计算机专业的课程设置后,结合我校对本科生的培养目标,提出了两种计算机应用序列课程设置方案.
"一河一策"编制短时间、高强度全省一刀切的指令,使得"一河一策"编制中多次出现"多河一策"现象,这其中有诸多偶然性因素起到了不容忽视的作用,但通过对辽宁全省河长制实施及"
为解决磁盘存储中的小写问题,本文研究了一种新的层次Cache结构.这种层次Cache使用虚存页面文件和部分系统RAM组成二级Cache结构,能很好地利用磁盘访问在大/小写以及随机/顺
财务重述是指上市公司以虚假信息,误导性信息或事后信息遗漏方式对历史财务报告进行补救的公告行为。近年来,财务重述现象在国内外呈现“蔓延”态势。上市公司财务重述的数量