【摘 要】
:
伴随着信息革命所带来的技术变革,人类社会所产生的信息规模正经历着爆炸式的增长和传播。然而,面对海量信息的涌入,互联网中的高质量信息被淹没在了信息洪流当中,人们越来越难以与外部世界进行有效的信息交换。因此,如何从海量的互联网资源对目标信息进行高效的挖掘与检索成为了当前亟待解决的关键问题。而作为信息检索过程中的关键环节,信息抽取技术扮演着重要的角色,引起了当前学术界和工业界的广泛关注。关系抽取作为信息
【基金项目】
:
国家重点研发计划(2018YFC0830200);
论文部分内容阅读
伴随着信息革命所带来的技术变革,人类社会所产生的信息规模正经历着爆炸式的增长和传播。然而,面对海量信息的涌入,互联网中的高质量信息被淹没在了信息洪流当中,人们越来越难以与外部世界进行有效的信息交换。因此,如何从海量的互联网资源对目标信息进行高效的挖掘与检索成为了当前亟待解决的关键问题。而作为信息检索过程中的关键环节,信息抽取技术扮演着重要的角色,引起了当前学术界和工业界的广泛关注。关系抽取作为信息抽取领域的一项关键任务,一直是当前研究的热点问题。现有的关系抽取方法受限于对大规模标注数据的依赖,往往难以实际落地。为了解决这一问题,远程监督关系抽取方法应运而生。远程监督通过自动化的手段缓解了大规模数据标注的问题,因此也是关系抽取领域的一个重要研究课题。当前的大多数远程监督关系抽取方法都将关注点放在了对于噪声数据的降噪处理上,而忽略了对于外部知识信息的挖掘和利用。因此,本文对实体和文本等不同方面的知识表示和融合方法进行了探索,尝试通过引入额外的知识信息来提高模型对文本的理解能力,并设计了融合知识表示的关系抽取模型,以实现有效的关系抽取。首先,提出了基于实体知识感知的关系抽取模型(Entity Knowledge Enhanced Neural Network,EKNN)。考虑到实体知识对于链接实体和文本的重要性,设计了实体知识感知的词嵌入方法,通过动态的方式将实体的语义知识和结构知识注入到模型当中,提高了模型的语义理解能力。然后基于选择性注意力机制,完成了句袋级别的特征表示,提高了对实体对进行关系抽取的能力。最终在广泛使用的远程监督公开数据集上与当前主流的远程监督关系抽取模型进行了对比实验和结果分析。EKNN模型通过将实体知识与词嵌入进行融合的方式,对实体知识中的丰富信息进行了深层次挖掘和利用,提高了模型对于文本的理解能力,取得了比主流方法更好的结果。其次,进一步提出了融合全局语境知识的关系抽取模型(Global Context with External Knowledge,GCEK)。针对现有远程监督方法中存在的文本语义信息缺失的问题,从文本层面构建全局的语境知识,并与实体知识相结合,实现了不同层次的知识融合。此外,还提出了全局语境增强的选择性注意力机制,有效提高了句袋级别的特征表示能力,进一步提升了关系抽取的效果。在公开数据集上的实验分析表明,GCEK模型在实体知识的基础上进一步引入全局语境知识的设计,能够对文本进行不同粒度级的语义建模,增强了模型的降噪能力,取得了当前最优的性能。
其他文献
为适应国家新型城市化发展,实现城市交通系统的优化,导向运输列车应运而生。作为一种新型的交通工具,导向运输列车结合了城市轨道交通与路面交通的优势,具备建设周期短、客运量大、低地板、节能环保、成本低等优点,未来将在城市交通领域发挥极大的作用。导向运输列车依靠车载各类传感器识别路面虚线实现循迹行驶,目前列车采用两套设备分别用于定位和循迹,导致成本较高;另外目前国内外对导向运输列车的循迹研究对横向偏移跟踪
轻钢门式刚架结构已经广泛应用于工业与民用建筑中,在遭遇强风荷载作用时结构容易遭到破坏,导致高额的经济损失。目前的抗风研究主要集中在50年重现期风荷载下的结构弹性抗风设计,而未关注罕遇强风下(重现期远大于50年)结构的弹塑性极限抗风性能,采用常见的增量动力分析方法,确定极限抗风承载力效率太低,计算时间过长。针对该问题,本文结合风荷载分布的随机性和不完全相关性的特点,提出了基于静力安定理论的刚性结构极
几个世纪以来,交通运输是国民经济的晴雨表。在大型国际贸易和经济项目的框架内,运输综合体在世纪之交继续显示其基本作用和高度重要性。在社会改革和经济转型过程中,运输的重要性尤其得到强调。“一带一路”(One Belt One Road,OBOR)是一条陆路基础设施走廊,位于连接中国、中亚、西亚、中东和欧洲的古老商队路线上,其最终目标是通过基础设施建设,扩大贸易和文化交流,将参与该项目的所有国家和地区整
可持续发展已成为人类社会发展的重要议程,但碳排放导致的全球变暖正阻碍着社会的可持续发展进程,中国作为最大的发展中国家积极履行节能减排责任,并在十四五规划中也提出了2030年实现碳达峰,2060年实现碳中和的愿景,节能减排的压力日益剧增。随着城镇化进程的不断发展,一方面民用建筑运行能耗已占全社会能耗的20%,能耗量巨大,另一方面建筑领域的减排成本较低,减排潜力较大,已成为节能减排的重要领域,因此如何
目前,在工程结构抗风设计中,仅考虑了风荷载作用下结构的弹性响应。在遭遇罕遇强风时,结构通常会进入弹塑性阶段甚至倒塌。但是目前结构的抗风设计未考虑罕遇强风下弹塑性变形对结构安全的影响。由于风荷载为随机荷载,需从概率的角度评估结构风致弹塑性变形,若直接对结构进行多样本风荷载下的非线性动力弹塑性分析,则耗时严重,因此提出风致弹塑性响应的概率分布简化计算方法具有重要意义,然而目前相关研究工作较为匮乏。历史
电动汽车因其环保、稳定、智能化在近年来呈崛起之势,但其能量补充方式和效率略显差强人意。插线充电存在着低效、触电风险等不利因素,因此将无线充电技术应用于电动汽车上成为了补齐短板的一种可能。本文以电动汽车场景下的中大功率无线充电系统为研究对象,建立多物理场耦合仿真模型,对其工作状态下的电磁分布特点与电磁屏蔽技术进行了研究,并且利用正交优化的方法实现了对此系统兼顾传输效率与屏蔽效果的优化设计。本文首先综
“对抗样本”是近几年出现在深度学习领域的新兴词汇,它指的是在数据集中通过故意添加细微的干扰所形成的输入样本,导致目标模型以高置信度给出一个错误的输出。研究对抗样本攻击方法对于认知深度神经网络缺陷具有重要理论和应用价值,并吸引了学术界的广泛关注。由于现有的大多数对抗攻击方法都是通过修改二维图像空间的部分像素实现攻击,其不能有效抵抗现实世界物体的3D物理特性(如旋转、平移和光照变化等),从而造成攻击失
由于高温超导带材的各向异性,其易受到垂直于带材表面磁场的影响。由于超导绕组端部磁场最大,因此对超导变压器进行端部磁场优化,降低带材表面垂直场,有利于提升超导绕组的电磁性能。国内对于采用二代超导带材超导变压器端部磁场的优化研究较少,本文对超导变压器的优化设计具有一定的借鉴意义。依托于实验室6.6 MVA高速列车用超导牵引变压器项目,等比例缩小研制了一台容量为5 kVA的超导变压器,为项目提供支撑。本
近几年,随着卫星通信技术的高速发展,卫星通信在抢险救灾、国防安全、军事战役等领域发挥了不可替代的作用。作为夺取未来空间信息的关键要素,卫星通信技术成为世界各国着力研究的热门领域。卫星根据轨道高度不同分为地球同步轨道卫星和非地球同步轨道卫星两类。地球同步轨道卫星具有轨位资源匮乏、端到端传输时延大的缺陷,而非地球同步轨道卫星中的低轨卫星与其相比,具备传输时延短、路径损耗小、覆盖范围广的优势,成为近几年
伴随着现代生活和社会生产的不断发展,人们对于电能质量的要求也不断提高。电力电子变换器正是顺应时代需求而生的,既能够实现电力系统的环境维护,也能够高效合理的利用电力能源。其中PWM整流器因为具有可以在单位功率因数下运行、支持能量双向流动等优点,广泛应用在电动汽车充电、可再生能源并网发电等领域。本文选择的研究对象是具有谐波补偿功能的单相PWM整流器,对单相PWM整流器的控制方式、直流侧二倍频波动抑制、