武器装备知识图谱构建研究

来源 :北京信息科技大学 | 被引量 : 1次 | 上传用户:smilepk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
武器装备是衡量一个国家是否强大的指标。发展信息化武器装备,既是军事变革的基本内容,也是实现我军信息化建设目标的关键所在。知识图谱可以看作无数个实体关系的三元组构成,将世界上的知识链接起来组成一个巨大的图网络储存在计算机中,帮助人们在某种特定问题上做出正确的决策。本课题通过构建武器装备领域知识图谱,采集武器装备信息以及分析武器装备之间的关联,从而实现对军队综合战斗力的评估。构建武器装备知识图谱过程中,主要对武器装备实体抽取、武器装备实体三元组抽取以及武器装备知识图谱知识融合几方面进行研究。在武器装备的实体抽取方面,提出了领域BERT模型与嵌入字词向量及字转化率向量的BILSTM模型的融合模型对武器装备实体进行识别。首先,使用BERT模型在海量武器装备语料上进行预训练任务。其次,使用Word2vec模型训练字词向量提供先验语义信息,同时嵌入字转化率向量向模型输入更多的先验信息。最后通过分层实体提取器对不同类别的实体进行提取。实验证明,该模型编码能力强和先验知识充分,在环球军事网语料上F1值达到91.436%。在武器装备的实体关系三元组抽取方面,提出基于分层序列标注的实体关系三元组抽取模型(HSL)。HSL将实体关系三元组抽取任务转化为主语序列标注任务和宾语关系序列标注任务。首先,HSL采用带有残差链接的GLU膨胀卷积编码后生成中间向量,将中间向量经过Self Attention机制得出主语编码向量,解码出主语的标签序列抽取主语。其次,将主语作为先验特征和先前的中间向量再次经过Self Attention机制得出宾语编码向量。最后,采用代表不同主宾关系的全连接层提取出某个主宾关系的编码向量,解码出宾语的标签序列抽取出宾语。实验证明,HSL能有效的应对三元组重叠问题,并且效果超过了主流的实体关系三元组抽取模型,在军事语料数据集上F1值达到79.17%。在武器装备知识图谱知识融合方面,提出了一种基于Glove和Word2vec模型融合的同义词扩展方法。利用Glove模型和Word2vec模型对武器装备语料进行词向量训练,并通过欧式距离计算两个词向量的相似度得出同义词扩展结果,将两种模型的扩展结果取交集得出最终扩展结果。实验证明,该模型在同义词扩展方面是可行的,在38条武器装备属性同义词语料下F1值达到62.72%。同时,采用不同模型扩展出的同义词对武器装备知识图谱进行了属性融合对比,该模型融合属性次数最多,在武器装备知识融合方面效果较好。
其他文献
本次翻译项目所用的源语文本为北京交通大学建筑与艺术学院的老师撰写和出版的《美丽乡愁:中国传统村落》中文版。书中用十章的内容讲述了中国十多个传统村落的建筑,展现了博
背景高血压是心脑血管疾病和肾脏疾病的主要危险因素,已成为我国重要的公共卫生问题之一。改革开放以来,中国经济的加速发展和区域经济发展的不平衡,导致农村劳动力的快速转
<正>根据艾瑞咨询对中国互联网体育用户的研究显示,截止到2 0 1 6年,我国线上观赛用户已达到观赛用户数量的52.8%,超过通过电视渠道观看体育赛事的观众,成为最主流的观赛方式
橡胶沥青应力吸收层具有延缓反射裂缝、加强层间结合、抗水损坏等作用。本文结合泗许高速亳州段橡胶碎石下封层的施工,详细介绍了橡胶沥青下封层的原材料性质、施工工艺和质
<正>我国少数民族体育游戏内容丰富、形式多样,具有显著的民族特色。少数民族体育游戏是先人智慧的结晶,其蕴含着深厚的民族文化。目前,我国小学体育课堂教学以短跑、羽毛球
以Sn-0.7Cu-0.05Ni-xSm/Cu焊点为对象(元素Sm含量分别为0,0.025,0.05,0.1和0.2(质量分数,%)),研究焊后与经过160℃,24,96和360h时效后,焊点界面金属间化合物(IMC)与抗剪强度
从当今大学生就业心理困境的具体表现看,可从学生、家庭、学校和社会这四个方面对大学生就业心理困境的主要成因进行剖析。积极心理学对大学生就业心理困境具有干预作用,应在
由于冲击响应数据具有较强烈的非线性与瞬态性,研究难度较大,目前在舰艇抗冲击技术研究领域还没有相应的标准规范或统一的滤波频率选取方法。利用冲击响应的冲量信息变化情况
以南疆地区少数民族学生为对象进行调查 ,在此基础上来探索影响少数民族汉语学习的主、客因素 ,并有针对性地提出了一些思考和建议
目的:了解温州市居民高尿酸血症的流行现状、主要危险因素与相关疾病的关系,以制定合理的预防措施。方法:采用多阶段随机整群抽样,抽取温州市3478名35岁以上常住户籍居民作问