面向航天情报领域的文本分类算法研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:gulongliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国航天事业取得了举世瞩目的成就。航天事业的快速发展离不开情报工作的支持,国外航天情报信息对于我国航天事业的发展具有重要借鉴意义。然而,传统的航天情报整理分类工作采用人工处理的方式,该方式的处理效率低下,其已无法适应当前的航天情报工作。现代化的情报工作已经形成以信息技术为中心的处理模式,该模式能够实现数据的自动化分类、规范化建模和科学化研究。因此,如何借助软件平台辅助情报信息分类、存储和分析,规范整个情报跟踪研究的工作流程,实现航天情报数据的自动化分类管理,成为当前航天情报工作面临的重要课题。本文在对航天情报领域知识管理和文本分类技术研究现状进行简要介绍的基础上,首先阐述了基于K近邻算法和基于支持向量机算法的传统文本分类技术,然后介绍了基于深度神经网络的深度学习文本分类技术,包括基于循环神经网络的文本分类技术和基于卷积神经网络的文本分类技术,最后在借鉴前人研究成果和总结不同文本分类方法优缺点的前提下,提出和设计了一种基于注意力(Attention)机制的TextRCNN-A文本分类算法,该算法的主要特点如下:(1)针对词的表征学习,本文提出了一种基于双向循环结构的卷积神经网络模型,与仅使用固定窗口的卷积神经网络模型相比,该模型能够准确捕捉上下文内容信息,也可以更好地消除单词的歧义;(2)针对文本的表征学习,本文设计了一种基于注意力(Attention)机制的池化层,该池化层能够有效减少信息丢失。注意力(Attention)机制能够合理分配上下文相关词的情感权重,并进一步提升模型的分类准确率,而且这种池化层的时间复杂度为O(n),整体模型是循环结构和池化层的级联,因此,该模型的时间复杂度仍然是O(n)。TextRCNN-A文本分类算法不仅具有循环神经网络和卷积神经网络各自的优点,还具有上下文相关词的情感权重分配合理的新特点。通过在五组公共数据集上与其它模型进行文本分类实验对比和分析,本文设计的TextRCNN-A文本分类方法在分类准确性方面与其它方法相比具有明显提升。最后将该算法应用于航天情报领域,设计并实现了基于TextRCNN-A算法的航天情报分类系统,该系统提高了航天情报文本分类的准确率,提升了航天情报工作效率,减轻了航天情报工作人员的工作量。
其他文献
<正>一、"认知——发现"理论简介布鲁纳是当代美国研究儿童认知发展和认知学习的心理学家和教育学家。他的学习理论是一种描述和解释学生知识学习过程的学说。他提倡知识的发
心理学史与“核心课程”申荷永(华南师范大学心理学系)0引言"核心课程"是当前心理学教学改革中的一个热点问题,也是心理学自身发展中的一个关键问题。我们认为,心理学的历史是所有心
<正>我国以培训为主要形式的中小学教师继续教育已经走过了十多年的历史,教师培训业已成为教师专业发展的有效途径,对教师培训的研究也成为教师教育研究的重要方向之一。从宏
针对目前汽车工业面临的最为突出的能源问题,采取降低汽车自重的方法是重要的措施之一。由于SMC(Sheet Moulding Compound)材料具有轻质、高强、耐腐蚀及成本低的特点,已获得广泛
作为一种特殊的地方行政单位,军在宋代行政体制中扮演着重要角色。宋代县级军以军或军使形式存在,军使与知县互兼且常以县的名义列于府州属下,因而常为人忽略。县级军体制萌
网络游戏消费的影响因素越来越受到研究者的关注,本文对该领域的研究进行了梳理。网络游戏消费的影响因素主要包括个体特征、网络游戏特征、社交特征、知觉特征和体验特征这
移液管中最后残留溶液如何处理的问题一直备受人们关注,而移液管中最后残留溶液的体积量与溶液的表面张力有关,不同溶液的表面张力不同,在移液管中的残留量也不同。实验通过
隐性课程是课程研究领域的一个重要而又经常被人们忽视的问题。本文从国内外特别是西方对隐性课程的研究入手,探讨其对我国当前课程改革和教育改革的一些重要启示。
随着世界一体化和我国经济的快速发展,公司简介翻译变的越来越重要。为了更好的了解我国公司简介翻译的研究现状和发展,该文基于中国知网数据库统计资料,从资料来源,研究方法