基于BERT与XGBoost的航天科技开源情报分类

来源 :郑州大学学报:理学版 | 被引量 : 0次 | 上传用户:cczxokli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航天科技开源情报文本内容较长且含有大量专有名词,影响了情报分类的效果,为了提升相关情报的分类准确率,提出一种基于BERT与XGBoost融合模型的航天科技开源情报分类算法。首先通过BERT模型的深度结构提取情报中的关键特征,然后利用XGBoost模型取代BERT最后的输出层,并依据BERT提取到的关键特征对相关情报进行分类。为了验证算法的有效性,设计了与TextRCNN、DPCNN等部分主流语言模型的对比实验,实验结果表明该算法在航天科技开源情报分类中的准确率与TextRCNN、DPCNN模型相比,分别提
其他文献
概念教学是教与学的基础,而概念课教与学的研究在课堂问题研究中有非常重要的地位,一直是教育教学方法需要研究的一个重要主题,在新课程思想的指导下,通过《古典概型》这一课
数学压轴题的命制对数学教师来说是一次挑战,更是非常好的历练和专业成长机会.鉴于福建省中考近四年来的数学试卷特征,在保持基本稳定的导向前提下,以及莆田市近年来在几何动
期刊
本文以《数列》单元复习为例,从分析复习现状出发,提出了重组单元结构,优化内容顺序;串联模块知识,构建网络体系;聚焦思想主线,升华数学思维;关注素养主线,发展核心素养等复
在众多的数学资料中都有这样两道习题:rn问题1 已知sinαcosβ = 1/2 ,求u=cosαsinβ的取值范围.rn问题2 已知sinα +sinβ =a,a∈(-2,2) ,求u =cosα +cosβ的取值范围.rn
期刊
人教版教材七年级数学上册第四章“几何图形初步”中线段和角是本章的重点内容,求线段的长度和角的大小更是重中之重,但受先学线段后学习角的顺序影响,往往在设计习题课时,是
期刊
Circular RNAs (circRNAs) are a recently dis-covered type of non-coding RNA derived from pre-mRNAs. R-loops consist of a DNA:RNA hybrid and the associated single
Mitogen-activated protein kinases (MPKs) play essential roles in guard cell signaling, but whether MPK cascades participate in guard cell ethylene signaling and
The alternative splicing of select genes is an im-portant mechanism to regulate responses to en-dogenous and environmental signals in plants. However, the role
【摘 要】2021年高考数学全国卷共6套,由教育部考试中心命制,包括新高考Ⅰ卷1套(不分文理科)、新高考Ⅱ卷1套(不分文理科)、全國甲卷2套(文、理科)、全国乙卷2套(文、理科).本文给出其中6道导数试题第(2)问简明的新解法.  【关键词】全国卷;导数;单调性;不等式;范围
课堂对话告别教师教、学生听的教学模式,使课堂变成师生共同的课堂;课堂对话终结了对数学学习的单调、无趣的认知,使数学学习变动更轻松、自由.然而课堂对话不是随意设置的,需要教师精心设计,正确引导.本文中,通过教学实践,浅谈关于课堂对话设置的几点建议.一、精心设计课堂对话内容,激发学习兴趣。