面向自然语言处理的语义框架与构式的自动提取与应用——基于新冠新闻英文语料的个案研究

来源 :上海外国语大学 | 被引量 : 0次 | 上传用户:yjtgu618215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新冠肺炎疫情影响全球已达两年之久,对社会和人们生活造成了颠覆性的影响,涉及到了整个社会的方方面面。语言作为人们赖以交流思想的主要媒介也难免因此而产生变化。大量新闻媒体一直以来都保持着对疫情的高度关注,也因此产生了大量可供语言研究者分析的新闻语料。这些语料相比社交平台语料而言,语言更加规范且能从多角度描述疫情和社会生活的关系,是很好的分析素材。本研究从认知语言学的视角出发,试图应用框架语义学和构式语法理论对新馆疫情新闻语料展开分析。两种理论在发展过程中有内在关联性,且以互补的方式对语言现象展开描述。一方面,框架语义学强调概念和事件之间的关联性;另一方面,构式语法则是对不同层面语言单位的规律性的同一总结。两者的结合能很好地展示语言的语义和形式构成,其所产生的素材也能为教学所应用。本研究中最大的挑战是如何从超八千万字的语料中有效抽取语义框架和构式信息。基于对两个理论的分析和目标信息的特征归纳,本研究提供了一种由自然语言处理技术助力的语义框架和构式提取方法,并将两个任务统一在同一个工作流程中。通过词嵌入和语句嵌入技术,我们得以比较两个语言单位的语义相似性,从而得到语义聚类,而通过对语义聚类的筛选和分类可以得到可能存在的语义框架和构式。本研究中,对于新冠病毒相关的新闻标题的研究很好地支持了我们关于目标信息分布的假设,说明了方法的有效性和可推广性。
其他文献
外向型学习词典服务于非母语学习者的语言理解与产出活动,兼具解码(理解)与编码(使用)的功能。其释义的简明性、准确性及充分性关乎学习者语言习得的成效,释义研究的重要性不言而喻。已有词典释义研究以宏观的理论探讨与经验总结为主,较少研究对某一具体词类的释义模式及特征做过微观的、精细化的描写。鉴于此,本文以《牛津高阶英语学习词典》(第10版)中的言语行为动词释义为例,采用局部语法路径对其功能成分与形式成分
学位
系统日志记录了计算机系统执行的关键操作和状态,为诊断和维护系统的运行情况提供了丰富的信息。当某些错误发生导致系统异常时,日志中也会有相应异常记录,系统开发人员与运维人员可以根据日志监控系统剖析系统的异常行为与错误。在系统日志中进行快速而又准确的异常检测、异常定位和异常修复,有助于及时消除隐患和排除故障,对于系统管理人员至关重要,引起了众多研究者的关注。随着系统和应用程序逐渐发展得多样复杂,每时每刻
学位
模糊限制语作为一种有效的语用策略,在日常交际中发挥着重要的作用。近年来学界对模糊限制语的研究方兴未艾,模糊限制语研究的内容及视角得到了不断的拓宽和丰富,然而顺应论视角下法庭层面的话语研究并不多见,对被告话语的关注度仍然不够,且普遍缺少法官对被告使用模糊限制语的回应策略分析。因此,本研究采用Verschueren的顺应论为理论框架,基于Prince等人的分类原则,运用定性与定量相结合的研究方法,对民
学位
新型冠状病毒病(COVID-19)是一种大流行病,传播速度极快,对人体的伤害很大。世界各国都爆发了新冠肺炎疫情,目前已导致全球600多万人死亡,感染人数超过4.58亿(截至2022年3月14日),严重影响了人们的生活。快速且准确地诊断出新冠肺炎感染是控制疫情蔓延的关键。为了快速高效地检测出COVID-19,降低COVID-19对人类生存的威胁,本文首次提出了基于强化学习的COVID-19诊断检测框
学位
话语分析倾向于研究社会或外部世界与话语之间的相互作用。认知语言学则关注相对微观的层面,能够拓展语篇分析研究,并为语篇分析提供了认知理据。立场是语言使用者所表达的立场,反映了他/她对所传达的事件和所描述的命题的态度和评价。同时,所有的立场话语资源又是语言使用者不同程度的主观性的指标,即说/写主体对所传达信息的承诺程度。本研究旨在从认知语言学角度探讨报纸社论立场和主观性话语表达的分布模式和策略。报纸媒
学位
目的 调查宫颈癌患者健康促进生活方式的现状,分析其影响因素,探讨与自我管理效能感的相关性,以期为临床宫颈癌患者的健康促进干预提供依据。方法 采用便利抽样法,选取2019年6月—2020年6月南昌大学第一附属医院妇产科收治的宫颈癌患者120例,采用自行设计的一般资料量表、中文版癌症自我管理效能感量表(SUPHH)及健康促进生活方式量表Ⅱ(HPLP-Ⅱ)进行问卷调查,回收有效问卷110份,对结果进行分
期刊
目的:观察首荟通便胶囊治疗功能性便秘的临床疗效。方法:将40例功能性便秘患者随机分成两组,治疗组口服首荟通便胶囊2粒,每日3次;对照组口服枸橼酸莫沙必利片5mg,每日3次,疗程均为2周。结果:治疗后两组患者的临床症状积分均较治疗前明显改善(P<0.05);治疗组总体疗效与对照组比较有统计学意义(P<0.05);两组均未发现明显不良反应。结论:应用首荟通便胶囊治疗功能性便秘总体疗效优于枸橼酸莫沙必利
会议
面向开放域的问答任务要求问答系统通过检索知识文档库,找到问题相关性段落,把问题和段落输入阅读理解模型后预测出问题答案。和限定域问答相比,开放域问答中问题查询内容没有约束,知识主题更加广泛,如何准确检索到和问题匹配的文本段落是预测出正确答案的关键。现有研究方法对语义模糊性问题的澄清能力不足,难以从中提取到关键特征,导致段落检索效果不佳,最终影响答案预测准确率。因此,研究检索模型对开放域问答有着重要意
学位
近年来,自监督学习因其简单且有效在深度学习领域大放异彩。自监督学习只通过无标记数据集,通过构造代理任务生成伪标签来训练深度卷积神经网络,解决了大规模标记数据集难以获取的问题。传统的自监督学习要求深度卷积神经网络使用外部代理任务(即基于图像或视频的任务)来编码高级语义视觉表示。本文提出了卷积神经网络内部的特征变换也可以看作是监督信号来构造自监督任务,称为内部代理任务。并且这种任务可以用于监督学习的增
学位
随着大数据时代的到来,数据成为重要的生产要素,数据规模也越来越大。云存储的出现减轻了用户的数据存储压力。然而,云存储无法保障外包数据的机密性,且云服务提供商本身是不完全可靠的,存储和查询服务质量会受到经济利益等因素的影响。可搜索加密技术通过构建密文检索方案保障了数据存储的安全,区块链则能够确保数据查询的正确执行,增强云服务的可信性,二者结合,能够有效解决云存储的安全性问题。在实际应用中,外包数据需
学位