面向信息处理的共现序列“把X”单位性质的辨认分析

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:mixcenter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以信息处理为方向,以“把X”为研究对象,基于大规模的语料分析和统计来探索“把X”字串的自动识别问题,以提高目前“把X”的识别精度为目标,望有助于今后的中文信息处理方面的应用研究。全文共分七章:第一章是绪论。本章明确研究对象,论述选题的目的和意义,概述“把X”的研究现状,简要说明本文的研究思路和采用的理论方法,最后对语料的来源进行简单说明。第二章是“把X”的类别及特征分析。本章逐条考察语料,考察每个词的词频来分类,分析各词频段的词的特征,明确词频是0%-100%的“把X”是本文重点研究的对象。第三章是“把X名”的辨认分析。本章重点考察“X”为名词性成分的“把X”字串,先依据语料库考察非句法结构和短语结构的“把X名”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X名”词。第四章是“把X动”的辨认分析。本章重点考察“X”为动词性成分的“把X”字串,先依据语料库考察非句法结构和短语结构的“把X动”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X动”词。第五章是“把X形”的辨认分析。本章重点考察“X”为形容词性成分的“把X”字串,依据语料库探讨非句法结构和短语结构的“把X形”来探讨辨认规则,然后依据语料库文本并参考词典来考察“把X形”词。第六章是“把X”辨认规则梳理。本章对全文的辨认规则做个梳理,总结辨认所用的词表和规则库,从总体上更好的把握本文的辨认规则。第七章是结语。本章对本文进行总体的概括和总结,分析本文存在的局限性和尚需解决的不足,并简单说明希望后续努力的方向。
其他文献
<正>从信用风险角度看地方政府债务评级我国地方债从2009年开始,经历了财政部代发代还、地方自发财政部代还、十省市自发自还几个阶段,其作为一个独立的债券产品也基本成型。
在魏晋南北朝近400年的时间内,虽有西晋的短暂统一,但总体而言,仍是战争不断,社会动荡不安,朝代更迭频繁。在这种背景下,传统皇权中衰,世家大族把持朝政。这些世家大族的形成
目的观察可视音乐治疗对精神发育迟滞患儿语言康复的疗效。方法 2013年3月至2015年3月潍坊市妇幼保健院儿童康复科收治的精神发育迟滞患儿80例,随机分为观察组和对照组各40例
参与式教学既是一种教学理念,又是一种教学方法。从理念上讲,参与式教学提倡以学生学习为中心,强调教学过程中师生平等和共同参与;从方法上讲,参与式教学要求师生平等参与到
对中国"关系"的任何界定都可能对复杂的社会现实做过于简单化的处理。运用在中国农村的田野调查中所获得的民族志资料,通过"实践"而不是"文化"描述和分析中国复杂的"关系"建
在当今世界,随着中国经济的不断发展以及国际地位的不断提高,越来越多的外国人学习汉语,并把汉语作为第二语言。在学习汉语的过程中,由于亲属之间的关系是人类之间最亲密的关系,所
本文根据联合国教科文组织定义的创业者素质的基本概念,归纳出大学生创业者的核心素质。论述了项目管理的概念内涵,探讨项目管理的基本过程,并对相关的项目管理工具进行阐述
对北京城市水资源现状和园林绿地灌溉中存在的问题进行了分析,提出发展集水型公园绿地的途径,包括收集道路、广场雨水、收集公园建筑屋顶的降水以及利用地形收集和利用雨水。
在对外汉语教学过程中,我们时有会听见或是看见留学生所使用或造出的句子不是那么的完整,甚至有时出现的不完整会曲解句子的“真情实意”,从而影响正常的交际。非完整句实质就是
目的:观察临床经验方益肺康心胶囊对慢性肺源性心脏病的治疗效果,及其对患者血浆PAF的影响。探讨其治疗慢性肺源性心脏病的机制。方法:本研究将符合入选标准的60例慢性肺源性心