面向信息处理的介词短语“往+X”的边界识别研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:FANSHENGHUA2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究的目标是实现介词短语“往+X”在计算机中的自动识别,要实现这一目标,首先就是要让计算机能够自己确定介词短语“往+X”的左右边界,介词短语“往+X”的左边界是介词“往”,难点在于计算机无法确定它右边界的位置,所以本文的研究重点在于如何确定其右边界的位置。我们选择了2001年《作家文摘》和《人民日报》的语料作为我们研究的基础,在对语料逐条标注的基础上进行分析,找到介词“往+X”右边界词的出现规律,再制定识别规则来识别短语。全文共分五章:第一章:主要是从本体语言学和计算语言学两个方面对前人研究进行了概述,提出我们的研究内容和目标。第二章:主要对介词短语“往+X”的右边界的识别分析,根据我们的语料,把可以进入“X”的分成词和短语两种情况进行分析,对介词短语“往+X”的内部组合结构进行归纳,并且判断“X”的右边界标志词。第三章:主要研究介词短语“往+X”的右相关词“Y”特征,由于“X”中隐性边界标志词很难识别,所以必须借助右相关词“Y”来帮助计算机识别。我们通过研究“X”的右边界和右相关词“Y”的共现特征,选择部分右相关词来帮助计算机识别。第四章:基于VisualBasic的介词短语“往+X”的自动识别,根据对“X”和“Y”的分析,制定算法,运用VB语言进行程序设计,让计算机可以自动识别出介词短语“往+X”,并且进行一定数据的测试,找出算法设计上的不足。第五章:结语部分是对本文的主要结论,研究目的,研究方法以及未来需要做的研究工作的说明。
其他文献
目的从健康体检妇女生殖道中分离乳杆菌,为开发复方益生菌制剂提供新型菌株并为临床通过表达各种重组乳杆菌以治疗女性生殖系统疾病寻找理论依据做好前期准备工作。方法采用
保监会近日发布《保险中介服务集团公司监管办法(试行)》(以下简称《办法》),以加强对保险中介服务集团公司的监督管理。业内人士指出,这是保监会推动保险中介机构集团化的一大步,也
报纸
本文对一个名叫小雨的汉语儿童进行录音,时间为小雨两岁两个月到三岁,并对其早期自发的与格结构和双宾结构进行了分析。在我们的分析中,我们对与格结构进行了广义的定义(Buss
建立了丹磺酰氯柱前衍生/高效液相色谱(HPLC)测定烟用添加剂中咪唑含量的分析方法。添加剂样品经碳酸盐缓冲溶液处理,丹磺酰氯进行柱前衍生化后,再经乙酸乙酯萃取,取有机层萃取液
经济发展进入新常态,面临新旧动能转换以及产业结构优化调整的压力,如何实现经济的高质量发展成为当前的研究热点。本文利用Malmquist指数法测算了我国285个城市全要素生产率
商品买卖交易行为是日常生活中的常见行为,描述这一动作行为的动词即为商品买卖类动词。现代汉语中,对此类动词的研究却并不多见。本文运用框架语义相关理论,在框架语义结构
上古汉语是汉语的源头,上古汉语的词义系统或隐或显地制约著後世词义发展的方向,所以上古汉语词义的研究意义重大。现状是古汉语反义词研究与古汉语同义词研究比较相封很薄弱
引进海葡萄进行室内水泥池与自然海区养殖试验,经过44天的养殖,随机测量称重,室内水泥池与自然海区养殖新长出的直立茎高平均分别为9.3cm与6.8cm,新增藻体重量为原先的1.4倍
目前,语法学界对词汇化和语法化的研究不断深入。我们以现代汉语中常见的表达主观想法的双音词“V_感来”为研究对象,包括词汇化和语法化历程,对其进行了较为系统的多角度考
本文从蒙古文信息处理的实际需要出发,对蒙古语性质形容词与其它词类词的搭配问题进行了探索,并运用统计学方法归纳出蒙古语性质形容词的搭配特征和句法关系。全文结构和基本