基于FST技术修正中文词性标注的研究与实现

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:gengyunshe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言理解又被称为自然语言处理或计算语言学,它是人工智能领域中的前沿难题之一。自然语言的识别和处理是人工智能研究的最重要的课题之一,也是人工智能研究的关键。其中在自然语言处理中的汉语词性标注是中文信息处理技术中的一项基础性课题,一个确切精准的词性标注对自然语言的理解有着极其广泛的意义,特别是在对输入文本进行句法分析、语义分析时,词性标注是一项必不可或缺的处理任务,因此,研究和实现汉语词性标注器具有重要的理论意义和实用价值。词性标注的方法主要有基于规则方法和基于统计的方法两大类。一般的情况下,为了达到更好的词性标注结果,往往都是采取基于统计和基于规则相结合。在基于统计的方法中,主要是采取隐马尔科夫模型(HMM),而基于规则的方法中系统中主要是采取有限状态转换机(FST)的方法,目前在自然语言处理上的应用上,FST方法在理论上还比较欠缺。在本文中就如何把FST应用到自然语言处理的词性标注上做了详细研究,并最终给出了实现的结果。最近几年来,在国际新一代计算机激烈竞争的影响下,自然语言理解的研究在国内得到了越来越多的重视,研究单位在逐渐增多,研究队伍也在逐渐壮大。目前在国内的研究中比较有代表的研究成果主要有机器翻译、语料库的研究、篇章理解研究、受限汉语研究等。但是不管怎样,所有的研究的前端都必须有词性标注这一项。
其他文献
UML(统一建模语言)是一种定义良好、易于表达、功能强且普遍适用的建模语言,用其可以从不同的角度对信息系统进行建模。用UML图(例如类图)建立的模型并不是足以精确的,经常还
目前,室内定位跟踪技术取得飞速发展。在民用领域,用于大型货仓的物资管理、医院病人监控和医疗器材管理、电厂和核电站等特殊区域的人员监控。在军事领域,用于士兵攻防训练
学位
随着石油钻井技术的发展,过去由于油层薄,油层可开采属性差等原因无法进行商用开发的油藏,现在可以通过钻水平井的方式采油。水平井技术提高了采油产量,出油效率,使过去无法
从第一个社交网站诞生以来,在线社会网络(Online Social Network)越来越流行,越来越多的人加入其中,也获得了研究者的广泛关注。然而,最近的研究结果表明,社会网络中的隐私泄
随着我国生产力的发展和制造业的转型升级,以及机器视觉技术的广泛应用,越来越多的企业引入机器视觉技术来降本增效,大量的造纸、印刷、玻璃等企业也引入了在线表面检测系统作为
人脸检测是指在输入图像中提取人脸(如果存在)的位置、大小、尺度和姿态等信息的过程。人脸检测技术是计算机视觉与模式识别领域的一个前沿课题,在身份识别、感兴趣区编码、
近年来,视频监控技术在各个领域得到了广泛的应用。目标检测与跟踪是视频监控技术的关键,如何有效的进行多目标检测与跟踪是目前视频监控研究领域的热点和难点。论文针对遮挡
随着多媒体技术和网络技术的不断发展,电信网、计算机网和有线电视数字网三大网络相互渗透、业务层上相互交叉,逐步走上了“融合”的道路。同时,随着网民数量的急剧增长,现有
狭缝联动摄影系统是一套用来测量弹丸飞行姿态,章动角,章动周期等参数的系统。传统的狭缝联动摄影系统由于线路比较多,仪器比较大,加上靶场常有野生动物啃食线缆,对于测试系统来说
随着网络通信技术和微电子工业的发展,工业现场控制系统已经从模拟控制发展到全数字控制,而且其性能也在不断地提高,在数控机床、工业机器人以及机电一体化加工与测试等设备
学位