汉语复句关系词及其搭配网络的特征分析与研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:z362523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复句是汉语的重要组成部分,复句中的关系词能够起到连接分句、显示或者隐式地标记分句间的语义和层次关系的作用。关系词在很多时候不是单独使用,而是以搭配的方式使用,即有多个关系词同时出现在不同的分句中。为了能够更好地掌握关系词在汉语中的使用情况,需要对关系词的特征开展更加深入的研究。特征隐藏于海量数据之下,所以研究关系词特征的前提是拥有一个包含海量复句的语料库,本文使用爬虫爬取了最近一年内《人民日报》、《光明日报》、《法制日报》等6家报纸电子版的新闻内容,经过段落分割、确定分句数量、提取关系词三个步骤建立了现代汉语复句语料库MCCSC。其中在提取关系词这个步骤中,本文根据以往的关系词提取算法,结合词性分析、依存句法分析、语义依存分析提出了一种判定条件较为简单的三层决策式汉语复句关系词提取算法TDRE。然后基于上述的现代汉语复句语料库进行以下三个方面的关系词特征研究:第一,基于统计学原理研究关系词的特征。首先统计复句在整个语料库的比例,发现汉语中85%的句子都是复句,这表明在汉语中单独使用一句话的情形很少,并证明了复句在汉语中的重要性;其次统计了含有关系词的复句——有标复句的比例,仅有20%。然后统计了在语料库中关系词的个数,共有541个不同的关系词,由于关系词存在跨类别现象,根据邢福义提出的汉语复句划分方法将其划分3大类、12小类后有599个关系词,其中并列类关系词的个数最多达到99个,假转类关系词最少,仅有14个。最后统计了不同种类的关系词在语料库中的出现次数,发现也是并列类关系词出现次数最多,假转类关系词最少。第二,基于复杂网络理论研究关系词搭配的特征。首先根据现代汉语复句语料库中出现的2329个关系词搭配建立了现代汉语复句关系词搭配网络CRWCN,统计了这个复杂网络的平均路径长度、聚类系数、度分布等特征数据:平均路径长度为2.41,聚类系数为0.1846,90%的关系词度小于20,这些统计结果表明现代汉语复句关系词搭配网络中存在小世界效应以及无标度特性,反应了汉语复句中的关系词总体上拥有较强的搭配能力。第三,结合汉语关系词使用情况分析了小世界效应以及无标度特性存在的原因,并提出了基于路径长度的复句缺失关系词填充算法MRWF和基于小世界效应的复句层次结构划分算法的设计思想并做了初步验证。
其他文献
环境中的有害成分时刻威胁着人们的健康。有机物传感器可以检测环境中有害成分的浓度,来判断是否存在潜在危害。半导体传感器被广泛应用于环境中有害成分的检测,一般的传感器受限于某一单一检测,选择性不高。固体电解质燃料电池型的传感器得到越来越多的关注,其中直接甲醇燃料电池(DMFC)型的传感器最为经典。DMFC的正负两极均使用Pt基的催化剂,最常见的就是商用Pt/C催化剂。但是Pt基催化剂材料成本较高,且P
学位
考试分数是反映学生学习情况最直接的指标,目前仍是教师了解学生知识掌握情况的重要途径。但是单纯地通过考试分数分析评价学生不足以令人信服,所以科学、量化的教育测量方法成为教师了解学生对知识掌握程度的重要手段。随着测量理论的发展,新一代测验理论既能从宏观角度评价学生能力,也能从微观角度诊断认知情况。认知诊断理论是其中极具代表性的,它是认知心理学和现代测量学结合的产物,也是目前心理测量学的重要热点[1]。
学位
学习策略一直都是我国教育学研究的重点,学校教育作为一种普遍的教学形式,对于初中阶段的学生来说,随着年级的升高,所学数学知识的难度增大,学习策略展现了其巨大的研究潜力.学习策略分为认知策略、元认知策略以及资源管理策略,学校数学教育中对学生学习的策略研究主要集中在学习策略的特点、应用现状以及在运用过程中对数学教育所产生的启示等方面.
期刊
非负矩阵分解是一种经典的对高维数据进行降维的方法,它较以往的降维方法有许多优良的性质,首先,它使分解后矩阵中的所有分量都非负,这在解决实际问题时更具有解释性,其次它能实现非线性的维数约减,因此其应用广泛。但是由于其解的不唯一性,导致在具体的实际问题中难以找到最优解,研究者们不再满足于非负矩阵分解模型,于是带有约束的非负矩阵分解模型开始逐步被提出,其中带有正交性约束的非负矩阵分解模型也即正交非负矩阵
学位
为了探究数学学习策略和数学学习拖延在坚毅性和数学学业成就之间的链式中介效应,采用整群随机抽样法,对重庆市564名小学高年级学生集体施测。研究表明,坚毅性、数学学习策略、数学学习拖延和数学学业成就两两之间呈显著相关关系;坚毅性能够正向预测数学学业成就;数学学习策略和数学学习拖延在坚毅性和数学学业成就之间都起部分中介作用;数学学习策略和数学学习拖延在坚毅性和数学学业成就之间存在链式中介作用。可见,坚毅
期刊
以《初中生数学学习策略调查问卷》为调查工具,采用分层抽样法,对衡水市3区和8县的1043名初中生的数学学习策略水平进行问卷调查。以原始数据为基础,通过标准正态化和线性变换处理得到标准分常模,结合3σ原则划分并确定相应的水平等级标准。应用所建常模对衡水市某中学初二年级普通班50名学生实施班级案例研究,选取1名学生实施个案研究,研究发现,衡水市初中生的数学学习策略水平整体处于中等,数学学习策略优秀的学
期刊
数学学习中需要让学生带着问题去思考和解决问题.带着问题去思考和解决问题要利用问题驱动去引导学生带着问题启发学生数学思维,引导学生带着数学问题去思考和解决数学问题,帮助学生提高分析问题和解决问题的能力.
期刊
因为小学生的自我管理能力有限,所以他们在学习过程中需要老师的指导。这样才能让他们不断增长基本知识,提高他们的理解能力,并且培养他们的创新思维和创造力。然而,如果他们对数学课程持有一种消极的态度,这将严重阻碍他们的主观能动性的发挥。如果没有足够的思考能力,没有足够的感知器官,即使老师教得再好,也很难让学生的数学水平有所提升,从而影响他们的个人发展。为了提升小学数学课堂的效果,老师需要熟练运用各种有效
会议
图论作为现代数学的一个重要分支,主要研究图所蕴含的内部结构.因子作为满足某些性质的图的支撑子图,一直是图论研究的重要课题之一,被广泛应用于网络通信结构,计算机科学等领域.本文主要通过图的结构理论和图谱理论,利用图的边数以及谱半径来给出图中存在某类特型子结构的充分条件.本文的具体内容分为六章,具体如下:·第一章主要介绍了论文的研究背景.通过对研究背景的系统分析,充分展现了我们研究工作的必要性和创新点
学位
报纸