基于统计的汉语词性标注方法的研究

被引量 : 0次 | 上传用户：sxx1203

【摘要】

：

随着计算机的发展，用自然语言作为人机交互语言已是必然趋势，这就对自然语言处理的深度和广度提出了越来越高的要求。词性标注是自然语言处理中的一项基础性题课，词性标注的正误

【作者】

：

梁以敏

【发表日期】

：

2004年期

【关键词】

：

完全二阶隐马尔可夫模型汉语词性标注数据平滑 Viterbi算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机的发展，用自然语言作为人机交互语言已是必然趋势，这就对自然语言处理的深度和广度提出了越来越高的要求。词性标注是自然语言处理中的一项基础性题课，词性标注的正误对汉语语料库标注、机器翻译和大规模文本的信息检索等都有重要的意义。本文对词性标注的方法进行了研究，分析了基于规则的方法和基于统计的方法的优缺点。获得上下文信息的多少和数据平滑的程度是评价词性标注统计模型性能的两个重要的参数。针对以前统计模型获取上下文信息有限的缺点，给出了一种针对汉语词性标注的、扩展的完全二阶隐马尔可夫模型，该模型方法比标准的统计模型获得更多的上下文信息。同时，本文采用性能稳定的基于线性插值的平滑算法解决了三元模型严重的数据稀疏问题。由于模型获取词汇概率和词性概率参数方法的改变，相应的修改了Viterbi算法。实验证明，这种新的完全二阶隐马尔可夫模型比现有的模型更能有效地提高汉语词性标注的正确率和消歧率。

其他文献

基于自然山体景观显现的视觉分析与高度控制——以南京浦口求雨山地段高度管制研究为例

自然山体的保护与显现具有多重价值。山体相临地段的城市开发受不同目标的多元约束。本文以南京浦口求雨山地段高度管制研究为例,从视域范围、高度取值、评估与修正等方面讨

期刊

山体景观视觉分析高度控制

雍正粉彩——宫廷典雅之风范

康熙朝以精湛细腻的五彩瓷绘为最,雍正朝则不能不说粉彩和珐琅彩,同样创烧于康熙晚期的粉彩与珐琅彩之间不仅有着互相关联的渊源,且同在雍正一朝达至艺术与技术的巅峰。近年

期刊

雍正粉彩康熙朝双耳瓶珊瑚红雍正朝珐琅彩

碱性蛋白酶的发酵与酶学性质的研究

本文对一株碱性蛋白酶高产菌株的发酵培养基及发酵条件进行了优化，并对酶的分离纯化工艺及酶的主要性质进行了研究。本文研究的主要内容和结论如下： 1、通过对菌株发酵培养

学位

碱性蛋白酶嗜碱性芽孢杆菌发酵纯化性质

镶嵌工艺修复举例

<正> 我國鑲嵌工藝技術歷史悠久,早在西周時期已有鑲嵌蚌泡的朱黑兩色漆器托,春秋後期到戰國時期又出現了青銅器上用金、銀、紅銅、玉石、松石、珊瑚等鑲嵌出的图案和畫像。

期刊

镶嵌工艺

数字水印版权保护系统

Internet发展迅速，尤其是多媒体存储与传输技术的进步，带来了数字媒体应用的迅速增长。多媒体数据的数字化为多媒体信息的存取提供了极大的方便，同时也极大地提高了信息表达的效

学位

数字水印PKI版权保护

都市圈交通发展战略规划理论及应用研究——以南京都市圈交通发展战略规划为例

都市圈是高度城市化地区空间组织的一种重要形式，其核心城市与内部其它城市的高强度联系塑造了圈层状的地域结构特征。都市圈内部城市间密切的经济联系有赖于强大的交通网络作

学位

都市圈交通系统战略规划南京都市圈

中国吉祥中国古代祥瑞观念的兴起、演化和主要门类

<正>祥瑞又名"符瑞"。祥瑞的征兆,即为吉兆,也就是吉祥的预兆。祥瑞思想在我国历史上由来已久。人们把见到的某一类奇异事物当作吉兆,见到这些就预示自己将会得到幸福。如:早

期刊

祥瑞观念统治者

物理概念与物理概念教学研究

物理概念的教学至始至终贯穿于物理教学中，一直是被关注的重点。对教师来说，概念教学的好坏直接关系到一堂课是否成功，而对学生来说，概念掌握得如何则直接反映了其物理学习成绩的

学位

物理概念物理概念教学教学原则前概念

基于哈密顿体系辛几何多口径面天线微波场的研究

随着无线电技术的不断发展，天线技术在太空飞船、科学探测站、地球观测站、通信卫星、广播电视卫星等领域得到了发展，口径面天线在天线系统中作为重要的组成部分，得到了越来越广

学位

哈密顿体系辛几何算法喇叭天线多口径面天线

教科书如何充分地体现课程标准

课程改革是一个系统工程，涉及到课程标准的研制和教科书的编写等方面。课程标准是国家管理和评价课程的基础，是教材编写、教学、评估和考试命题依据。在新一轮的课程改革中，课程

学位

课程改革课程标准教科书

基于统计的汉语词性标注方法的研究

与本文相关的学术论文