结合词性加权的胶囊网络实体关系联合抽取模型

来源 :石家庄铁道大学 | 被引量 : 0次 | 上传用户:seakider
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,科技政策逐年增多,如何高效地从科技政策中提取所需信息成为了亟待解决的问题。依托于“河北省科技创新大数据公共服务平台”对科技政策实体关系抽取模型进行了研究与实现。构建基于胶囊网络的实体关系联合抽取模型以从科技政策中提取科技实体关系;为了进一步提高模型运行效率,构建结合词性加权的胶囊网络实体关系联合抽取模型。主要研究内容如下:(1)基于胶囊网络的实体关系联合抽取模型根据科技政策的特点提出基于胶囊网络的实体关系联合抽取模型。对于文本内容领域性较强的问题,使用word2vec训练有针对性的词嵌入向量以提高文本数据表达的准确性;对于词向量重要程度不一致的情况,使用自注意力机制对词向量进行加权;对于卷积神经网络结构单一,池化层丢失信息较多的情况,使用胶囊网络丰富结构层次,通过胶囊保留文本信息,利用动态路由提高分类效果。通过实验证明了提出模型的可行性,并使用单一变量方法检验几个重要参数对实验的影响。(2)结合词性加权的胶囊网络实体关系联合抽取模型构建基于双向门控循环单元代的胶囊网络实体关系联合抽取模型,并通过实验证明基于BLSTM模型的宏平均F1值比基于BGRU模型的较高,基于BGRU模型比基于BLSTM模型运行时间短;针对词向量表达语义不完善的现象,且考虑到胶囊网络包含一定的位置信息,通过加入词性特征丰富文本信息,构建两种基于self_attention的词性加权模型,并通过实验验证了后期结合模型的有效性;针对词特征与词性特征权重分布问题,提出使用人工鱼群算法通过迭代寻优的方式优化两个特征权重,提高分类效果。通过实验分别证明了两个优化方案的有效性。
其他文献
多环芳烃(Polycyclic Aromatic Hydrocarbons,PAHs)是一类在环境介质中普遍存在的持久性有机污染物。它在河水沉积物上的吸附行为,特别是在有机质上的吸附行为,直接影响着其环境归宿及人体健康。腐殖酸(humic acid,HA)和黑炭(black carbon,BC)是河水沉积物有机质(sediment organic matter,SOM)的主要组分,是影响沉积物和水
随着我国城镇化和人口老龄化进程的推进,流动人口迁居家庭化、第三代照顾需求增加、家庭养老模式偏好及独生子女政策效应显现等结构性因素,综合家庭团聚的现实需求,催生出“老漂族”这一特殊的群体。他们与原有的社会支持系统相脱离,在陌生的城市里遭遇到异地生活的融入困难,良好的朋辈群体关系可以帮助“老漂族”更快更好地融入异地城市生活。运用小组工作方法,帮助“老漂族”解决交友条件受限、交往能力欠缺、家庭支持缺乏和
为实现多个用户秘密信息在公开信道上的安全传输的目的,通常情况下,参与通信的用户需要提前共享密钥并用于后续对秘密信息的加解密。在量子密码领域,常利用量子密钥协商(Quantum Key Agreement,QKA)完成密钥共享。QKA是所有合法参与者共同协商,贡献相等,最终共享密钥的一种密钥共享方式,任何参与者无法提前确定最终密钥。目前,在一些多方量子密钥协商(Multiparty Quantum
阅读是从语音、词汇、句法、语义等层面不断提取和整合文本信息的过程。语法知识能够帮助读者准确理解句子意义,把握篇章衔接手段,因此在阅读理解的过程中起着至关重要的作用。近年来,越来越多的研究者提出语法知识可以进一步划分为显性、隐性两种不同的维度,并对显性及隐性语法知识的概念、区别和测量方式等诸多问题进行了探讨,但这两种语法知识在二语阅读理解中的作用至今却鲜有研究涉及。因此,本研究拟探讨显性、隐性语法知
进入深亚微米阶段以来,SoC的功能愈加强大使得测试数据量日益增加。大量测试数据在增加测试整体难度的同时,对已有测试设备的速度、通道数、存储提出更高的要求。通过改进测试设备可解决上述问题,但同时使测试成本大幅度增加。为了降低测试难度、减少存储开销与测试成本,测试数据压缩成为解决上述问题的重要手段。论文中针对测试过程中大量测试数据对实际分析产生的影响,提出基于K-Means聚类的分块测试响应压缩方法。
电液控制系统通过液压执行机构实现对系统给定量实时精准的跟踪。电液控制系统易于实现远距离操作、大范围调速、输出大功率等功能,具有功率体积比大、响应速度快、抗负载刚性强等优点,使其在现代工业动力系统中具有广泛的适应性。然而,工业技术的高速发展对电液控制系统的控制精度提出了更高的要求。电液控制系统是一个复杂的非线性系统,存在建模不确定性、参数时变性、非线性摩擦和外干扰等不确定性非线性问题,其中摩擦特性的
自物联网概念提出以来,物联网及其相关技术不断飞速地发展。特别是低功耗窄带物联网领域(LPWAN),以NB-IoT为代表的技术推动着物联网技术深度应用。本文依据热力领域的实际需求,基于硬件系统的低功耗技术,综合设计并实现NB-IoT物联网系统,全文主要工作如下:首先,本文评估了基于NB-IoT技术的通信系统的性能,根据实际需求,依据NB-IoT模组和MCU提供的不同工作状态,在保证广域网环境信息传输
职业农民代表先进的农业生产力,是助力乡村产业兴旺、推动乡村振兴的主力军。职业农民肩负着引领现代农业发展的使命,随着一系列支持职业农民发展的政策不断落实,一批职业农民成长为专业大户、家庭农场主、农民专业合作社理事长等,并逐渐发展为农村创业兴业的典型,其能够改变传统的农业经营方式,进行机械化、集约化、市场化生产经营,获得可观的收入,并推动休闲农业、创意农业等新业态的发展,促进农业现代化发展。然而,现实
随着人类社会发展进程的加快,资源短缺和环境问题越来越严重,寻求无污染且可再生的能源,保障人类社会健康可持续的发展,成为全人类共同关注的现实问题。太阳光能是一种天然可循环利用的可再生资源,且利用过程中几乎无污染,太阳能的利用成为人们解决能源问题的重要途经。分布式光伏发电利用电池板将太阳能转化成电能,这种零排放的发电方式有效地保护了环境,也大大的节约了传统资源,还可以给投资企业带来可观的投资收益,具有
人口老龄化伴随着社会发展加剧增长,独居老人作为现代社会中突显的弱势群体引起全社会的普遍关注。据调查多数独居老人在家庭结构、社会地位、社会角色转变及自身资源减少,日常起居缺乏必要照顾,社会交往封闭单一,缺少人际沟通和情感支持等诸多情况下,独自面对年老体衰的现实容易产生消极、沮丧和自我封闭的心理,无法适应当下环境,跟不上时代逐渐与快速发展的社会脱节,在社会融入方面出现问题,而且我国养老服务行业政策并不