关于对数线性模型在词性标注中的应用

来源 :计算机科学 | 被引量 : 0次 | 上传用户:cosmos_lin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词性标注是自然语言理解中很长期的问题,但对于大词性标注集的词性标注,它的标注精度还很低。为此我们应用隐含马尔可夫方法(HMM)和最大熵方法对大词性标注集的词性标注问题进行了研究,并在此基础上提出了关于词性标注的最新方法——对数线性模型,以此来提高词性标注精度。此次实验分别在运用HMM模型时,提出了新的光滑算法;在运用最大熵模型上,集成了详细的局部和远距离的上下文特征信息;在对数线性模型中,集成了HMM模型和最大熵模型,并进行了对比。结果表明综合了多源信息的对数线性模型标注精度达81.52%,取得了比传统的HMM模型更好的结果。
其他文献
氧化铝厂的含硫化氢废气经过燃烧炉燃烧将其转化为二氧化硫,其转化率为接近100%,燃烧硫化氢过程中的热量可以自求达到平衡。燃烧产物SO2被该厂的赤泥附液吸收,最后排放浓度达
进入后危机时代,世界经济中仍存在诸多不确定、不稳定因素。各国为刺激经济增长和保护就业,贸易保护主义再次风行,且呈现出新特点,致使全球经济进入贸易摩擦高发期。应充分发
文章针对八数码的求解,通过使用并行指针结合所设计的经验式启发函数,在无需回溯的情况下能求解所有的测试数据,且测试结果与理论值相同.
《史记》与《汉书》中的民族列传以汉族为主体视角记录下西汉一代“中原—边疆”的“华夷”关系,但历经两汉政权嬗代中“大一统”到“正统”社会主流意识形态的转型,史家所持
<正>出版社:上海译文出版社本书由日本NHK特别节目录制组制作的《看不见明天——越来越严重的年轻女性之贫困》《调查报告:女性贫困——新连锁的冲击》等节目内容集结而成,重
<正>在网络传播时代,官方网站已经成为各种社会机构传播形象的平台和窗口。现在国内外新闻院系都建立起了各具特色的官方网站,但由于文化传统和教育制度的不同,中西方新闻院
丰子恺人道主义思想浅论王文胜丰子恺是中国现代文学史上一位重要的散文家。他所有的作品中都贯穿着一种人道主义思想。其特征主要体现在三个方面:首先,承认人具有人格和自己的
由于社会条件的不成熟,辛亥革命后建立的共和政治出现了种种问题,招致人们的批评.袁世凯及其拥护者利用此种批评,称共和制易造成内乱,不适合中国,而君主制则符合中国的历史与
当前社会信息化已经进入到新媒体时代,提高农民科技素质的渠道与方法应该伴随着时代的进步有所创新。文章通过新媒体技术在农村领域的应用阐明新媒体技术可以应用到农村哪些
本文概述了草图理解技术(包括草图识别和语义理解)的现状。首先,草图识别包括预处理和图形识别,根据各种图形处理机制,介绍了四种图形识别方法:基于笔划的、基于图元的、基于