【摘 要】
:
词间关系指词汇之间的各种语义联系和句法关系。词间关系研究的主要内容包括:对以词条为表现形式的语义概念之间的较强语义关联进行识别和数理度量,构建如叙词表、本体等形式
论文部分内容阅读
词间关系指词汇之间的各种语义联系和句法关系。词间关系研究的主要内容包括:对以词条为表现形式的语义概念之间的较强语义关联进行识别和数理度量,构建如叙词表、本体等形式的语义知识库,进而对词间关系进行可视化处理等相关研究。词间关系研究是自然语言处理的基础性研究之一,其研究成果广泛应用于信息检索、叙词表和本体自动构建、机器翻译等诸多领域。 词间等级关系是词间关系的重要类型之一,又称上下位关系、属分关系或属种关系,在叙词表、本体等知识库的关系表示当中占有相当高的比例。词间等级关系识别研究的方法主要分为基于字面相似的词间等级关系识别、基于模式识别的词间等级关系识别和基于数理统计的词间等级关系识别三类。其中,基于字面相似和模式识别的词间等级关系识别方法在识别结果的准确率方面具有较好的效果,但召回率很低。与之相反,基于数理统计的词间关系识别方法,利用海量的语料库和统计语言模型,自动化程度高,识别结果的召回率高。随着计算语言学的迅速发展,基于数理统计的词间等级关系识别方法正成为识别词间等级关系的主流方法。 针对已有汉语词间等级关系作为识别方法存在的不足,笔者在借鉴国内外相关研究成果的基础上,以机器可读词典(MRD)作为语料,提出了一种基于词典释义构建决策树模型进行语义挖掘,利用机器学习进行词间等级关系识别的方法,并设计和实现软件系统对所提出方法的效果进行验证。 通过实验,得到了词语间释义关系概念集合相关特征与词间等级关系间的相关性结论,并且在词间等级关系的识别过程中取得了较好的效果。实验结果表明,利用词语间释义关系概念集合的重叠关系特征,构造决策树模型,通过机器学习的手段,自动化识别词间等级关系的方案思路是可行和有效的。
其他文献
随着电子文件数量的急剧增加,电子文件管理目前已理所当然地成为世界各国档案领域的研究热点,而对电子文件的管理又必须通过电子文件管理系统来实施,因此国际上对电子文件管理系
在科技高速发展的今天,社会的信息化程度越来越高,这给我国的洪灾应急的发展起到了推动作用。但是由于各个地方洪灾应急部门各自为政,目前为止还没有一个统一、完善的洪灾应急信
随着新课改的不断深入推进,小学体育教学发生极大变革,新课改注重学生德智体美劳全面发展教育理念已经深入人心,并得到广大教师响应.故而,在新形势下,小学体育教学成为现阶段
在当前知识经济时代,如何及时满足日益增长的信息需求已经成为关乎现代企业生死存亡的重要课题。公共图书馆作为储存和传播知识信息的公益文化机构,为企业提供信息服务有着相当
发球技术是高校网球教学的关键内容,是提升高校学生网球技能的关键部分.如何优化高校网球发球技术教学,在高校网球教学中占据了至关重要的位置.本文分析了网球发球技术的动作
随着时代的发展和进步,人们越来越重视体育锻炼.为了能够满足时代的需求,高校应当重视体育人才的培养,为体育事业的发展培养更多专业人才.在人性化的视角下,加强体育教学工作
小学生身体成长较快,每天都需要一定量的锻炼,跳绳可以满足小学生锻炼的需要,这项运动可以锻炼学生的体力、协调性、耐力、肺活量、心脑的供血功能等.跳绳作为体育教学内容,
电子文件的系统依赖性决定了电子文件管理系统具有重要作用。组织机构实施电子文件管理系统,不仅是为了提高组织活动效率,还要保证系统生成、存储和处理的文件的真实性和证据性
体育文化素养是中职学生通过体育知识学习和体育活动参与而形成的各种体育能力和行为的综合表现,通过体育知识深浅、体育技能优劣、体育技术好坏、体育意识强弱、体育个性突
随着我国新课改的提出,许多高校都已经改变了传统的教学模式,并且尝试使用翻转课堂这一新型教学模式,在大学公共体育教学改革开展以来,采取翻转课堂的教学模式也至关重要.本