面向社交媒体文本的个人事件抽取研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:Green__lucky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和社交媒体的快速发展,越来越多的人使用社交平台分享自己的观点,描述发生的个人事件。这些个人事件中包含了例如用户行为的动机和结果、隐含的情感等丰富信息,具有巨大的价值。面对海量的个人事件文本,不借助自动化的处理工具,企业或个人很难有效的从中获取到关键的有效信息。个人事件抽取(Personal Event Extraction)旨在从海量的事件文本中自动化的抽取出结构化的个人事件信息,因此具有重要的现实意义和应用价值。目前,面向社交媒体的事件抽取面临两个挑战:1)事件类型开放,无法对所有事件类型进行预先的定义;2)缺乏对应的标注语料。现有的事件抽取方法要么基于事件类型设计对应的抽取模板,缺乏灵活性,且不能抽取新类型事件;要么基于传统机器学习模型,但需要为各种事件类型准备充足的标注语料。为此,本文拟构建一个个人事件数据集,并在此基础上研究个人事件领域某些事件类型下训练样本少的问题。本文基于小样本学习,对面向社交媒体的个人事件抽取任务进行研究。本文的主要工作有:(1)基于FrameNet外部知识库,本文构建了个人事件本体,并基于Twitter数据构建了个人事件数据集。(2)针对个人事件检测问题,考虑到个人事件领域某些事件类型下标注语料稀少,本文基于小样本学习框架,提出了一个基于多注意力机制的原型网络模型(MAPN)。针对社交媒体文本长度较短,模型通过引入词性标注、依存分析等外部信息并结合双向LSTM网络和自注意力机制来增强文本中词语的特征表示。此外,本文还引入样例级别注意力来增强原型网络中类原型表示的计算,提升模型对多样化文本表示的应对能力。实验结果显示在本文构建的数据集上,本文提出的模型优于对比模型。(3)针对个人事件抽取问题,本文提出了一个基于图信息增强的原型网络模型(GI-APN)。在MAPN模型的基础上。针对个人事件文本表示较为抽象、语义表达较为深层的特点,将依存解析结果构建为图表示。并引入图卷积神经网络对依存关系图进行建模,将其融合到词特征表示中,增强词特征中包含的语法结构信息。此外,模型实现了事件类型和事件论元的联合抽取。实验结果显示本文提出的模型相比于对比模型有较大的性能提升。
其他文献
随着硬件计算能力的提升,卷积神经网络(CNN)在数字图像处理等多领域都做出了重要贡献,与此同时,二值卷积神经网络(BCNN)以无需进行乘法操作提取特征的优势在轻量级方面倍受关注。但二值算法特点使设计面向硬件的高效BCNN结构并不简单,其中最大的问题在于,通过改进网络结构弥补二值化带来损失的算法并不一定有利于硬件实现。本文的研究目标就是克服这一难题,从二值算法和硬件加速两个方面协同对二值网络进行研究
随着社会经济的快速增长,城市化建设在不断地加速,然而供水企业对管辖区内的供水管理并没有得到相应的提升,其中城市供水管网的漏损检测和定位依然是供水企业所面临的两大难题。目前在城市化供水管网的建设中实现了部分对供水管网监测的系统工具,但大多难以实现对管网漏损的检测和定位,对管网漏损的检测还是通过人工巡逻的原始方式。针对这一现状,本论文提出了基于数据驱动结合DMA(District Metering A
发展装配式建筑作为我国建筑行业由粗犷型向集约型发展升级的重要途径,是改变目前建筑行业高污染、高能耗和低效率的有效方式。标准化设计是发挥装配式技术优势的重要基础,也是实现工业化生产建设的重要前提。当前我国装配式建筑仍处于发展探索阶段,标准化体系建设不完善,标准化设计方法发展滞后,装配式建筑标准化水平无法定量评价,导致装配式建筑标准化设计难以把控,存在建筑构件种类繁多,构件标准化程度低,无法发挥工业化
近年来,随着我国发电企业蓬勃发展,发电量逐年快速增长,而发电企业生产成本持续攀升、创新能力不强等一系列问题却愈加凸显。因此,如何提高电厂的信息化、智能化水平,降低管理成本,提高生产效率,是增强我国发电行业核心竞争力所必须要解决的关键问题。为了实现信息化和智能化工业生产,越来越多的发电企业趋向于建设工业互联网平台全面互联人、机、物,并对日常生产中产生的大量数据进行分析,从而为企业发展决策提供智能化支
人工智能的快速发展以及物联网的快速普及,推动了智能汽车的快速发展,汽车的智能化发展的趋势也将会越来越明显。汽车的作用将不会再是一个简单驾驶性的工具,而是作为一个可以移动的智能化空间,将集合多种新兴技术和功能,应用程序也会越来越丰富。因此,智能汽车也会给用户传达越来越多的信息。随着智能汽车传达信息的增多,传统的交互界面将会被重新定义,用户获取信息的方式也会变的多样化,人与智能汽车之间的交互方式也将会
信息化城市建设的工作在当前的我国社会经济发展的背景下逐渐地发挥着越来越重要的意义和作用,其中最为普及的信息化技术之一就是城市可视化,促使当前的我国城市化建设工作可以在当前的信息化技术充分发挥的背景下逐渐地获得良好的发展和效果。可视化对应到公路建设工程管理领域就是通过科技方法或手段,将在建工程项目直观地展示在管理者面前,帮助管理者更好地了解公路建设工程的建设进度、建设效率等实际情况,从而提高公路管理
随着经济社会发展,电网供电可靠性的要求越来越高。铁塔作为输电线路的重要组成和支撑部分,是输电线路安全稳定运行的前提和保障,铁塔整体倒塌或局部破坏都将导致输电线路的时效断电,对电网造成重大损害,严重影响社会生产与生活。特别是在运的ZS、ZGU2两种塔型,容易发生倒塔影响供电安全的事故。因此,本文针对上述两种塔型的加固方案处理进行研究,可在节约塔材的同时,避免产生新立杆塔所需要的征地及政策处理的相关费
中巴经济走廊项目对一个国家的经济、社会和环境可持续性具有持久的影响。在建设项目的生命周期中,项目管理通过在不同阶段整合资源和利益相关者,以实现可持续的项目成果,发挥着至关重要的作用。巴基斯坦的建筑项目在建筑业中有了新的层面,但如果有竞争力的承包商,就可以取得成功。在众多的管理挑战中,在可持续项目管理中关键成功因素的选择,对项目有深刻的影响。鉴于此CSFs在可持续的项目管理中,基于资源的观点理论与企
研究背景及目的:股骨颈骨折是困扰老年人的一大健康问题,老年股骨颈骨折患者术后3个月死亡率高达13.5%。老年患者骨折前常合并多种内科疾病,围手术期并发症多,这些因素为老年股骨颈骨折的临床治疗增添了许多难度。股骨颈骨折可分为非移位型骨折和移位型骨折,其中移位型股骨颈骨折损伤较严重,骨折端不稳定,术后不愈合率和股骨头缺血坏死率较高。因此,老年移位型股骨颈骨折患者如无手术禁忌,均应采取手术治疗。人工髋关
Background: Globalization provides endless opportunities of travel and learning.As an example of global mobilization,China has recently become one of the largest host countries for foreign students in
学位