【摘 要】
:
事故灾难事件是公共突发事件的重点之一,对公共安全风险识别和应急处理均有重要影响。网络和自媒体的普及使得我们有可能在各类网络短文本中获得公共突发事件相关的有价值的信息。事件抽取在事故灾难事件信息挖掘和提取方面有着极其重要的作用,例如及时获取事态信息、建立结构化案例库等。由于文本数据特征决定了事件抽取方法的效果上限,将字粒度语义特征提升到词粒度或实体粒度可以使模型获取更高维、更丰富的语义信息。基于此,
【基金项目】
:
国家重点研发计划项目“国家公共安全平台”(项目编号:2018YFC0807000);
论文部分内容阅读
事故灾难事件是公共突发事件的重点之一,对公共安全风险识别和应急处理均有重要影响。网络和自媒体的普及使得我们有可能在各类网络短文本中获得公共突发事件相关的有价值的信息。事件抽取在事故灾难事件信息挖掘和提取方面有着极其重要的作用,例如及时获取事态信息、建立结构化案例库等。由于文本数据特征决定了事件抽取方法的效果上限,将字粒度语义特征提升到词粒度或实体粒度可以使模型获取更高维、更丰富的语义信息。基于此,本文针对事故灾难事件相关网络短文本信息,从文本语义特征增强的角度对事件抽取任务展开了深入研究,研究内容包括以下两个方面:(1)基于命名实体识别任务反馈增强的事件抽取方法研究。为了使模型能够学习到数据中更高维度的语义特征,本文对事件抽取领域经典模型Bi LSTMCRF进行了改进,提出了一种基于命名实体识别任务反馈增强的事件抽取方法FB-Latiice-Bi LSTM-CRF。第一步,将Lattice机制融合双向长短期记忆网络Bi LSTM作为模型的共享层,获取句子中的词语语义特征;第二步,增加命名实体识别辅助任务联合学习和挖掘实体语义信息,同时将命名实体识别任务的输出反馈到输入端,提取其中实体对应的分词结果作为Lattice机制的外输入,以减少该机制自组词数量大的负荷,并进一步强化实体语义特征的提取。最后,用最大高斯似然估计方法最大化同方差不确定性,计算模型总损失,解决多任务联合学习产生的损失不平衡问题。实验结果表明,基于命名实体识别任务反馈增强的改进方法有效的提升了事件抽取效果。(2)基于知识图谱的文本预处理方法研究。通过改造模型结构可以增强模型对文本高维语义特征的学习能力,同时引发了结构要求高,泛化性较差的问题。为此,本文基于知识图谱技术,提出了一种能够增加文本语料的显式语义特征的文本预处理方法,易被模型学习。第一步,对事故灾难事件相关语料进行实体类型定义和实体提取,通过实体关系扩展使实体间建立了联系,并借助Neo4j图数据库构建目标事件“事故灾难”知识图谱;第二步,基于已建立的知识图谱,用滑动窗口扫描方法和实体链接技术对文本语料进行实体识别和分词;最后通过文本语料字粒度与实体及其属性的嵌入,融合得到包含实体属性和实体分词语义信息的文本嵌入结果。实验结果表明,该方法可广泛适用于各类事件抽取模型中,并明显提升模型效果。
其他文献
本文讨论了拟线性奇异摄动两点边值问题的基于等分布原理的自适应数值解法及其误差分析。为了证明拟线性算子的无穷模和*模之间的稳定性,我们引入了和拟线性算子间存在特殊的转化关系的线性算子。利用线性算子的格林函数及其解的性质,先是由比较原则得出了线性算子对应格林函数的界,后由线性算子根据内积关联的关联算子是M矩阵的性质证明了格林函数分段单调,利用不等式证明了关于线性算子的无穷模和*模之间的稳定性,最后通过
脑机接口(Brain-Computer Interface,BCI)技术可以帮助人们通过脑电信号来控制机器,从事各种工作,具有广阔的应用前景和巨大的市场潜力。近年来,随着计算机软硬件的快速提升,脑机接口技术发展也变得迅速。但是,脑机接口技术仍处在发展阶段,存在数据的信噪比低和被试间差异等问题,导致分类的准确度较低。基于此问题,本文的主要内容如下:(1)由于不同被试间的脑力负荷程度不同,会影响脑电数
近年来,由于物联网技术与“互联网+”理念的迅速发展,市面上增加了大量基于物联网技术的智能设备。在推进物联网产业的进程中,急需大量熟悉专业技术,具备开发与创新能力的技术型人才,为物联网专业与希望从事物联网相关工作的学生带来挑战。本文基于物联网的思想与架构,设计并实现了物联网实训系统。该系统具有完整的结构,集成多种通信方式、多种传感器、多种执行器,有助于学生理解物联网架构,培养学生的实践能力。物联网实
安全多方计算是近年来随着信息交互的频繁发生,为保护交互信息的安全于1982年由Yao教授首次提出的,是有效保障交互信息安全的一种方法。简单来说是指多个参与者持有各自的私有信息,在互不信任的情况下,相互交换信息,共同合作计算一个函数得到最终的计算结果,且在信息交互的过程中得不到其他参与者的私有数据。安全多方计算目前已经发展为密码学界的一研究热点问题,在现实生活生产中有广泛的应用,本文研究的计算几何问
呼吸运动是哺乳动物维持生命不可或缺的节律性活动,呼吸节律的产生中枢位于哺乳动物延髓腹外侧区一个被称为pre-B(?)tzinger复合体的区域。呼吸节律在正常状态下是均匀而整齐的,而在病理状态下会紊乱且不规则,因此研究呼吸节律产生的动力学机制及其控制有重要意义。本文基于pre-B(?)tzinger中胞体-树突耦合神经元模型,利用相平面分析、分岔分析、快慢动力学分析以及ISI(峰峰间期)分岔序列等
自第三次工业革命以来,信息技术在全世界都有了飞速的发展,我们的生活也发生了翻天覆地的变化,人与人之间的距离越来越近。和之前的通信不发达相比,现在的计算机、互联网、手机等工具为人们的沟通提供了条件,哪怕相隔万里之远,也可以瞬间听到对方的声音,看到对方的表情。但任何事情都有两面性,信息安全隐患也深深地潜伏在我们生活中。密码学是信息安全的重要保证。随着专家学者们对密码学的深入研究,安全多方计算被提出并成
本文研究了渐近非线性基尔霍夫型方程正解的存在性和非存在性.我们的结果还包括非线性项在无穷远处共振的退化情况.据我们所知,我们的正解条件也不同于现有的结果.本文研究了方程(?)(1-1)其中a≥0,b≥0,Ω为RN(N≤3)中的光滑有界区域.假设下列条件一致满足:(f1)f∈C(Ω×R,R)满足f(x,0)=0;(?)(f2)存在μ∈R,使得#12(f3)f3/f(x,t)关于t>0单调不减;(f4
“三山五园”是中国古典皇家园林的杰出代表,也是当今挖掘历史、传承文化价值的重要研究领域。香山静宜园在“三山五园”中占有一山一园,在历史发展的不同阶段均体现出特殊的文化价值。近年来,对于香山静宜园“二十八景”和“别垣二景”的个例研究与复建工程正在逐步开展,“别垣二景”之一的见心斋是静宜园内唯一一处具有江南文人园特色的园中园,其保存完好、文化价值突出,值得深入研究挖掘。当今快速发展的三维数字化技术,为
在大健康的时代背景下,人们越来越意识到环境可以具备一定的恢复性。而研究环境恢复性与偏好关系密切。对于这方面的研究的手段越来越客观,眼动追踪技术就是其中之一。本研究关注的是具有恢复性水景的偏好研究,具体包括对于水景类型、元素、属性的偏好,探究并总结出对应恢复性水景规划建设启示及意见。探究不同类型水景偏好主要采用的研究方法是文献研究法、眼动实验法、问卷调查法等。在探究水景不同元素和属性阶段,以眼动实验
域名解析系统已经发展成了一个不可忽视的网络基础设施和信息枢纽,在人们进行日常网络活动中是不可缺少的一环。但是网络恶意域名出现越来越频繁,对域名解析系统造成恶意影响,同时也对国家、社会和人们的生活带来了各个方面的损失。因此,恶意域名检测也显得越发重要。目前恶意域名检测的方法多是基于黑名单匹配和机器学习方法来进行。黑名单匹配的方法依赖于已经检测完成的恶意域名黑名单,时效性弱,更新慢;基于机器学习的方法