基于正负加权的事件触发词识别及其应用研究

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:zheng829
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件作为人类知识的基本单元,一直以来备受多个领域研究人员的青睐。近年来,随着互联网的迅猛发展,网络新媒体已逐渐成为人们获取信息的主要方式。同时,突发事件频发,网络空间中充斥着海量的包含各类突发事件信息的电子文本数据。对电子文本中的这些事件信息加以有效利用,能为信息检索、舆情分析、文本主题分类等多个研究领域提供重要支持,使得事件抽取技术成为了研究热点。事件触发词识别作为事件抽取的子任务,目前存在使用词特征作为基准时有效辅助特征不足以及对辅助特征利用不够充分的问题,从而导致最终的识别效果不够理想。针对这两个问题,本文提出了一种基于正负加权的事件触发词识别方法,并在此基础上对基于事件触发词的文本主题分类应用进行了研究。主要研究工作包括以下两个部分:(1)基于正负加权的事件触发词识别研究。为了提升使用词特征作为基准时的事件触发词识别效果,通过构建包含正负特征的触发词表,并结合正负加权算法,提出了一种基于正负加权的事件触发词识别方法。首先,结合前后位置词和依存句法中的父、子节点词,自定义了一种叫做关联词的特征,该特征的加入对于基准方法效果的提升有较大的帮助。然后,将单一特征分为正特征或负特征,并结合正负加权算法辅助基准方法进行事件触发词识别,提升单一特征在识别中的作用。最后,将多种特征组合在一起,并结合正负加权算法辅助基准方法进行事件触发词识别,进一步提升本文识别方法的效果。实验结果表明,基于正负加权的事件触发词识别方法取得了令人满意的效果。(2)基于事件触发词的文本主题分类应用研究。首先,借助词频-逆文档频率的思想,提出了类内触发词频-逆类别频率的方法,用于计算事件触发词特征和文本主题类别间的特征权重。然后,针对不同事件触发词与文本主题类别间相关性的差异问题,对卡方检验方法进行改进,使其能够体现正负相关性,并将其作为权重因子与特征权重相乘,完成特征权重的计算。最后,将文本中各个特征与文本主题类别间的特征权重按照文本主题类别进行累加,并将累加值最大的主题类别作为文本的分类结果,完成文本主题分类。实验结果表明,基于事件触发词的文本主题分类方法取得了比较理想的效果。图[15]表[12]参[65]
其他文献
公共基础设施建设有助于改善国民经济的增长和社会民生,满足人民群众对美好生活的向往,直接关系到到公众的根本利益。习近平总书记指出,基础设施是互联互通的基石,也是国家要进一步发展面临的瓶颈。建设高质量、可持续、抗风险、价格合理、包容可及的基础设施,有利于一个国家充分发挥资源禀赋,更好融入全球供应链、产业链、价值链,实现联动发展。但是由于公共基础设施具有较高的外部性和一定的非竞争性和非排他性特点,是一种
传统的隐喻研究将隐喻视作一种语言现象,并对其构成及修辞功能进行研究。随着20世纪80年代认知语言学的兴起,以及概念隐喻理论的提出,越来越多的研究试图从认知角度对隐喻进行解释。此外,语料库方法的应用则提高了概念隐喻研究的客观性和科学性。然而,以往对概念隐喻的研究多集中在日常语言、新闻、政治演讲等体裁上,对作家的文学作品的研究则相对较少。关于文学作品中隐喻的研究,David Lodge(2004,p.
目的:以横断面调查的方法研究慢性肾脏病(Chronic kidney disease,CKD)不同分期与血瘀证积分之间的联系,掌握血瘀在CKD发展过程中的严重程度及变化规律,分析血瘀证积分与不同理化检测指标间的联系,为中西医结合判断CKD预后及活血法治疗CKD提供客观证据,同时归纳总结车树强教授运用不同活血法治疗CKD的临证诊疗经验。方法:收集天津市中医药研究院附属医院肾病科病房符合纳入标准的CK
目的:比较成人骨性Ⅱ类错(牙合)患者治疗前与行拔牙掩饰性矫治治疗后软硬组织、牙体长轴的变化;探讨行拔牙掩饰性矫治的成人骨性Ⅱ类错(牙合)患者下前牙牙体长轴变化与软硬组织、上前牙牙体长轴变化的相关关系;探讨行拔牙掩饰性矫治的成人骨性Ⅱ类错(牙合)病例治疗前颌骨不调的极限。方法:(1)选取采用拔除四颗前磨牙进行固定矫治器的掩饰性矫治治疗成功的成人骨性Ⅱ类错(牙合)患者24例,男2例,女22例,治疗前平
轮状病毒(Rotavirus,RV)广泛存在于世界范围,是导致幼龄动物和人类腹泻的主要病原之一,对养殖业和人类的健康危害很大。益生菌及其代谢产物作为维护肠道健康的重要成分,具有抑制RV感染的能力,并且在维持肠上皮细胞间的紧密连接、肠组织屏障稳定、保护肠粘膜中发挥重要的作用。为探究干酪乳杆菌(Lactobacillus casei)对A组OSU株猪轮状病毒感染猪肠上皮IPEC-J2细胞和昆明乳鼠小肠
数据流分类作为数据挖掘领域中的一个重要分支,能够获取数据流中有价值的信息,已成为当下研究热点之一。数据流具有可变、无限、快速等特征,导致传统的分类方法面临较多难题,如样本标注和概念漂移等。因此,如何建立精确的分类模型以及实时检测概念变化,成为数据流分类面临的挑战。迁移学习利用源领域和目标领域之间的相似性,将知识从源领域迁移到目标领域。基于迁移学习的数据流分类方法能够构建出高效的分类模型,解决数据流
RB是第一个被鉴定的肿瘤抑制基因,其同源基因广泛存在于动物、植物和微生物中。已有研究表明,RB是调控细胞增殖、细胞分化、细胞凋亡与器官形成的关键基因。植物中存在RB的同
研究目的通过对北京中医药大学东方医院肾病科维持性血液透析患者氧化应激指标与一般资料、营养状况、透析充分性、炎症、贫血等的相关性及差异性,探讨维持性血液透析患者氧化应激状态与各生化指标的相关性;同时结合患者中医证候信息进行分型,探讨MHD患者的氧化应激水平在各中医证型之间的差异性,为中医药抗氧化治疗提供依据。研究方法1.收集北京中医药大学东方医院血液净化中心进行维持性血液透析治疗符合纳入标准的患者共
研究目的:对比研究腹腔镜下大子宫切除术(Total Laparoscopic Hysterectomy,TLH)以及腹腔镜辅助阴式下大子宫切除术(Laparoscopic Assisted Vaginal Hysterectomy,LAVH)的临床疗效。研究方法:回顾性选择镇江妇幼保健院2012年1月至2016年12月接收的120例大子宫(术后子宫称重大于280克)患者作为研究对象,按照手术方式分
无粘性土与其他工程填土材料相比,具有较大的优越性。一般来说无粘性土的压实效果较好,其最佳含水量较小、最大干密度较大;在静力作用下,压缩性较小;在动力作用下,特别是在振动作用下很容易被压实。由于其出色的性质,无粘性土已被广泛应用在工程填土领域。然而,准确、快速测定无粘性填土的压实状况一直是困扰工程界的技术难题。目前,施工人员仍然主要采用传统的有损检测方法对无粘性填土进行测定,传统方法存在破坏性大、耗