基于小句关系定量分析的语篇测量方法

来源 :东北农业大学 | 被引量 : 1次 | 上传用户:flytraker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年来,随着计算机科学理论的发展,计算语言学在机器翻译、语音识别、人机交互等诸多方面发展迅猛。但是如今的机器翻译或语音识别等人工智能产品仍然存在着自身局限性。以机器翻译为例,它对于大篇幅的整句或者逻辑语义相对复杂的文本,翻译质量令人堪忧。其根本原因在于机器对于语篇的理解是建立在代表语言元素的二进制信息和简单的算法基础上的;而人对于语篇的理解则是建立在对于小句关系的理解之上的。另一方面,丁建新、陈安玲等人对大量语篇体裁的统计研究明确了不同语篇体裁中小句关系分布特征具有不同的特点,这为基于小句关系的语篇体裁鉴别提供了理论基础。因此本论文以韩礼德系统功能语言学中的小句关系为切入点,在广泛文献调研的基础上,充分吸收韩礼德系统功能语言学中关于小句复合体系统理论的优点,论述了该理论下小句关系分类框架存在的不足,并结合国内学者程晓堂对小句关系分类框架的改进意见,首次提出了小句关系特征矩阵和语篇相关度的概念,并在这两个概念的基础上提出了基于小句关系定量分析的语篇测量方法。小句复合体作为语篇中最高级别的语法单位,其内部各个小句之间相互作用,存在多种复杂的关系,这些关系蕴含了丰富的信息,而小句关系特征矩阵作为语篇中小句关系分布特征的直观体现,我们可以从中解读出关于该语篇的丰富的语言学意义。语篇相关度则是从统计学的角度给出了不同语篇体裁之间相关程度的量化分析方法。由语篇相关度概念引申,我们给出语篇差异这个概念,它从另一个侧面反映了不同语篇体裁之间的小句关系分布特征的差异性,并且能够直观地给出具体的差别所在。这些概念和方法的提出,使得我们可以借此对机器进行大规模的语篇数据训练,从而实现大规模语篇材料的自动体裁判别和分类的功能。本论文以定量分析为主,结合统计分析、案例分析、演绎推理、综合归纳、文献检索等诸多研究方法,以不同语篇作为样本数据,其对应的小句关系特征矩阵作为模型参数进行研究。首先对语篇中小句关系类别进行分析得到小句关系特征矩阵,进而对小句关系特征矩阵作误差校正预处理和统计学相关性检验,最后得到语义相关度、修辞相关度和投射相关度的加权平均值,即语篇相关度,可以以此定量地表示不同语篇之间相似性程度。这样便建立了一种基于小句关系定量分析的系统化的语篇测量方法。经过多个语篇案例的实际检验,验证结果与预期符合很好,充分说明了该理论的合理性、正确性和可行性。本论文所提出的基于小句关系定量分析的语篇测量方法不仅可以在微观上推断出语篇本身蕴含的丰富的语言学信息,而且可以在宏观上得出不同语篇体裁之间的相似性程度,并给出定量化的描述。该语篇测量方法在机器语篇分析中具有很强的可操作性和应用价值,为科学、客观、系统的语篇分析研究开拓了新的研究思路。
其他文献
随着企业规模扩张、社会交往增加、社会影响力日益扩大,民营企业社会资本的来源更加多元。从最初的由血缘、地缘关系带来的原生性资本,扩展到由商业交往形成的互信,如果企业
2013年最高人民法院发布的第17号指导案例,明确的问题有两个:首先,由于家庭生活性质的消费需求,买一辆车,相关的欺诈纠纷可以用消费者保护法规定进行处理;其次,如果经汽车的销
背景 随着生物医学模式向生物心理社会医学模式的转变,社会心理因素在疾病的发生发展中的作用逐渐受到重视。在消化系统,心理应激与上消化道溃疡的关联性已经得到证实,与肠易
《老无所依》在麦卡锡娴熟的西部文学创作基础上,融合了犯罪文学的诸多元素,对通俗文学传统元素进行了颠覆性的改写,并将它们重构成为全新的样貌。本论文一方面讨论小说对传
律师负有维护社会公平正义的任务,是现代社会必不可少的法律职业。然而,在市场经济蓬勃发展和思潮多元化的今天,律师为公共服务的属性相应减弱,导致一些人认为,维护正义并非
[背景]神经纤维瘤(neurofibroma)是神经来源的良性肿瘤,但部分肿瘤侵犯周围组织,该肿瘤可以独立存在,也可以作为Ⅰ型神经纤维瘤病(neurofibromatosis type 1,NF1)的一部分。
多环芳烃(polycyclic aromatic hydrocarbons, PAHs)是环境中微量且广泛存在的持久性有机污染物,由于PAHs具有高度的稳定性、半挥发性和脂溶性,可经大气干湿沉降、污水灌溉、
近年来,信息化浪潮席卷全球,3D打印技术等现代信息技术对社会发展产生了深远影响,并且也影响到了人才培养与学科教学。传统教学模式的局限日益显现,3D打印技术作为新兴的科技
“专利海盗”对我国是一个新名词,近些年才进入我国学界的研究范围。专利海盗发源于美国,指那些自己不从事生产,收购大量专利专门进行起诉活动获取侵权损害赔偿或专利许可费
目的:比较多层螺旋CT(MSCT)与MRI结合磁共振胰胆管造影术(MRCP)在胆道梗阻性疾病中的诊断价值。方法:临床纳入2014.01~2019.01于我院经过手术病理证实的102例胆道梗阻性疾病