基于图模型的汉语口语依存句法分析研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:jzsoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在口语对话系统中,为了更好地和用户进行交互,正确理解用户的意图是非常重要的。有研究证明,对口语语言进行句法分析对于口语语言理解任务是至关重要的。然而,现在的很多对口语句法分析的研究都集中在西方语言和日语等语言上。虽然,近几十年来已经有很多关于汉语句法分析的工作,不过这些都是基于书面文本的研究,几乎没有针对汉语口语的句法分析研究。因此在本文中,着重展开对汉语口语的依存句法分析研究。首先,几乎没有公开的具有句法标注的汉语口语语料。为了促进汉语口语依存句法的研究,丰富汉语口语语料,本文首先基于一个新的依存句法标注体系构建了一个具有依存标注信息的汉语口语语料库。这个新的依存句法标注体系具有一些针对汉语口语的依存句法关系。其次,考虑到传统的基于书面文本的句法分析器在口语语料上的性能会降低。因此,本文考虑构建一个针对汉语口语的依存句法分析器。基于图的模型是依存句法分析常用的模型之一。研究这个问题的突破点是设计更加有效的针对汉语口语的特征模板。本文对汉语口语的特点进行了详细的分析和归类。最后一共找到了6个典型的汉语口语特点,比如易位,重复,重叠,省略等。针对这些特点,设计了一个原子特征以及三个特征模板。这个原子特征是一个和标点相关的特征,可以捕获句子的结构信息。针对在汉语口语的标注语料中存在着很多的结构歧义和标签歧义这一现象,本文也设计了相应的特征模板。实验部分测试了模板的有效性。结果表明,原子特征和三个模板特征都是有效的。增添了三个模板特征之后的新的依存分析器效果显著好于原来的依存句法分析器。值得说明的是,这是少有的在汉语口语上做依存句法分析的工作。
其他文献
存货质押融资业务是当前供应链金融领域中融资最重要的实现形式之一,是推动经济发展,提高企业竞争力的重要力量。存货质押融资业务的顺利开展,为处于资金支持弱势、降低成本
对于立木内部结构的检测对于森林的可持续发展、已伐木材的高效利用具有重要的意义。现阶段存在的立木检测手段大多对立木造成一定的损伤,无损探伤技术又多数只能应用于已砍
随着多媒体产业的迅速发展,在生活中音频分析、图像分析和视频处理等方面的研究得到了越来越多人的关注,如何更好地去描述一个音频、图像或者视频就成为计算机视觉工作者们的
目的:探讨分析慢性心力衰竭合并抑郁状态的中医证候要素特点及中医证型的分布规律,为中医药防治慢性心力衰竭合并抑郁状态提供一定的临床客观依据。方法:选取青岛市海慈医疗集团慢性心力衰竭的患者230例,进行病例采集及问卷调查,采用zung编制的抑郁自评量表(SDS)作为测评工具进行抑郁状态评价。查阅慢性心衰及抑郁状态的中医证候相关文献,参考《中药新药指导原则》、《中医临床诊疗术语-证候部分》及《中医诊断学
最近的国家林业局荒漠化报告指出,西藏地区土地有16.78%正遭受沙漠化威胁,高原地区的沙漠化问题已经成为该区的主要环境问题之一;研究该区域沙漠化问题产生和发展对气候变化
多孔聚合物石柱代表了二十世纪九十年代代初出现的一种新的高分子材料,这是革命性的分离技术。这些分离介质是大块多孔材料,在整个柱上的微孔通道允许溶剂的清晰流动。物质转
近年来,由先天性缺陷、运动和交通事故等原因引起的骨植入修复病例急剧增加,对性能优异的骨材料需求量与日俱增。众所周知,自体骨是骨移植的优选材料,但是其来源有限且容易引起供给部位坏死。相对于自体骨,异体骨的来源则较为广泛,但其依然存在着整合与重塑缓慢、免疫排斥反应以及疾病传播等诸多问题。理想的人工骨植入材料,应能够模拟天然骨的成分和结构,促进骨缺损部位的修复,并在体内提供长期良好的生理环境。然而,目前
沥青路面使用一段时间以后,其整体性能将不能满足路用要求,但作为路用材料仍有很高的利用价值。通过路面再生技术,可以使旧沥青路面材料重新满足路用要求。沥青路面再生时如
本研究利用SDO、SOHO/LASCO等获取的太阳耀斑和日冕物质抛射(coronal mass ejection,CME)数据,筛选出太阳24周20112015年期间所有M级和X级的强耀斑伴随有CME出现的事件。接下来
在当前手性分离材料(Chiral Stationary Materials,CSMs)的发展基础上,为进一步提升环糊精手性分离材料(CD-CSMs)的应用水平,制备了一系列新型CD-CSMs并将其应用于手性分离中,探究了CD官能团、键合臂等因素对不同种类手性分离的影响。并且,针对CSMs原有种类研究逐渐饱和的现状,从材料层面对手性固定相的设计进行创新。(1)通过“叠氮-炔”点击化学反应将手性氨基酸