融合关联信息的GCN文本分类模型构建及其应用研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:bareet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]有效学习文本上下文语境和词语间的关联性,提升文本自动分类的性能.[方法]提出一种融合关联信息的BERT-BiLSTM-SGCN (Similarity-GCN)长文本分类模型.首先,利用BERT得到待分类长文本的词向量初始特征,将其输入BiLSTM模型中捕获语义关系,并将其输出作为图卷积网络的节点表示,其中每个节点代表每个词特征;然后,使用词之间的相似值作为图卷积网络中的节点之间的边表示,并将结合得到的节点表示以构造图结构作为SGCN层表示;最后,将利用SGCN层得到的长文本表示输出至全连接层中得到最终的分类结果.[结果]实验结果表明,针对知网中文文献主题多分类问题,模型分类准确率达到了0.83409,均优于基准模型.[局限]将文本数据处理成单标签进行多分类,未考虑到多标签的分类问题.[结论]所提模型能够有效地对长文本数据进行建模,将BERT、BiLSTM和SGCN模型相结合,可以大大提高模型的分类性能.
其他文献
本研究运用扎根理论,通过对以广东省26位名师工作室主持人为代表的卓越教师的访谈资料进行分析、归纳,探究一线教师视角下卓越教师核心素养的构成,其主要内容包括专业精神、教育教学知识与技能、反思与自主发展以及专业示范引领4个维度共12个要点;并对“互联网+”时代教师核心素养的多维共生关系、恒与变、应然性与实然化进行了讨论分析,从而深化作为专业发展高级阶段的卓越教师核心素养的认识.
运用计算机辅助药物设计寻找红毛七抗炎生物碱类活性成分.以“红毛七”为关键词,在TCMSP数据库中搜索生物碱类化学成分,从Pubchem数据库下载相应化合物结构;再从蛋白质数据库中下载与抗炎作用明确的7个靶点蛋白,采用Sybyl软件中蛋白质预处理工具确定活性区域,应用Surflex-dock模块对小分子与靶蛋白进行分子对接,通过Total Score打分函数筛选出活性成分,采用Discovery Studio、Pymol软件分析结合最好的蛋白复合体的相互作用力.筛选出具有较好结合活性的化合物9个,其中Cau
探讨“职业教育适应性”的内涵及专业设置与社会需求、专业群与产业链岗位群、人才培养目标与行业人才市场需求、专业核心技能与产业链岗位需求的适应性,以武汉职业技术学院传媒专业为例,分析高职传媒专业在增强职业教育适应性方面所遇到的难题与困境,提出增强传媒专业职业教育适应性的路径和举措,展示高职传媒专业增强适应性的初步成效.
高校作为当代中国科学技术和精神文化发展、生产的主要场所,作为我国培养合格社会主义接班人的主要阵地,始终发挥着承人才培养、科学研究、服务社会、文化传承创新的重要功能,为社会经济发展做出了重要贡献.廉政文化建设走进高校对高校全面从严治党和思想政治建设,廉洁校园文化建设和提高校园学风校风的风清气正都有着巨大的促进作用.而高校的历史文化资源天然地成了高校开展校园廉政文化建设的重要途径,但过去仍然存在不重视和利用率不高等问题.拟立足于高校廉政文化建设的理论与实践,对历史文化遗存对校园廉政文化建设的应用进行研究,并提
教育智慧治理是以提升教育治理水平为根本目的,运用大数据技术和治理理念进行教育治理的新模式.政府在利用大数据进行教育智慧治理的变革中,面临着治理思维更新迟缓、治理体制建设迟缓、治理技术负外部性、治理基建效能低等困境.以协同治理为理论基础,提出构建以互联网智能技术为基础的政府导向型“四维”合作平台建设,为教育智慧治理提供实现路径,最终实现教育善治.
算术表达式的计算是C语言程序设计中经典数学问题,计算机在解决这个问题时,一般是用逆波兰算法,把中缀表达式转化为后缀表达式,然后再使用栈计算实现,这种算法利用递归的思想,并结合栈复杂数据结构才能实现.设计一种算法,通过将运算符进行优先级排序,找到了复杂计算问题的简化模型,只需要应用循环和数组就可以实现复杂算术表达式的计算.
情境是让枯燥、难懂的数学知识被幼儿了解并接受的重要途径,幼儿园学前教育阶段教师必须要用好情境来引导幼儿积n极主动接触数学,培养幼儿对数学的学习兴趣,让幼儿觉得数学是有趣的、好玩的,真正实现让幼儿在玩中学数学。n很多幼儿教师遇到过设置情境后却吸引不来幼儿注意力的情况,本篇主要讨论幼儿园数学活动中应用情境的可行性,n分析借情境来改善幼儿数学学习现状的具体策略,为幼儿教师设置情境、做好数学教学提供一些思路和帮助。
[目的]探索开放式创新社区中识别不同领域领先用户的方法,为企业解决获取外部知识资源的问题.[方法]首先利用LDA提取用户主题构建用户知识二分网络,其次融合领先用户知识结构特征和传统个体属性特征,提出基于指数随机图模型的链路预测方法识别不同领域的领先用户,并以华为产品定义社区为例进行实证研究.[结果]识别出华为社区内20个领先用户,平均链接概率都大于0.900,并且与传统链接预测方法相比,ERGM方法AUC最大,达到0.9967;ARC最小,下降到0.0132.[局限]未考虑时间因素对用户知识的影响.[结论
以“生活的营地,成长的营地”为主要特征的幼儿园生活营地课程,是新时代和当今教育改革发展的需要,有其独特的内涵。n生活化是生活营地课程的基本特征,让幼儿成长于生活营地是课程最终目标。生活营地课程围绕“生活技能、运动健康、自然环保、社会交n往”四大方面架构课程目标,评价体系通过多元评价主题、多种评价方式指向幼儿发展,通过对环境、内容、资源等课程实施要素进行创新n实践及优化管理,实现促进幼儿全面发展的根本育人目标。
[目的]综合运用不同预训练模型的词向量进行文本语义增强,解决基于Word2Vec、BERT等模型所表示的词向量存在先验知识缺失的问题,提升在新闻数据集上的分类效果.[方法]以今日头条新闻公开数据集和THUCNews新闻数据集为实验对象,使用BERT、ERNIE模型通过领域预训练,分别提取上下文语义信息和实体、短语的先验知识信息;结合TextCNN模型生成高阶文本特征向量并进行特征融合,实现语义增强,进而提升短文本分类效果.[结果]相较于传统的Word2Vec词向量表示,使用预训练词向量表示的分类算法模型准