基于深度学习的多标签文本分类研究

来源 :兰州理工大学 | 被引量 : 0次 | 上传用户:yxzapricot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,网络中存在着大量的结构化数据与非结构化数据,其中文本数据是最常见的非结构化数据之一,如何有效地对这些非结构化文本数据进行分类,对于网络内容搜索和获取,舆情分析等具有重要的意义。文本分类任务是根据给定文本内容对文本赋予相匹配的标签。其中多标签文本分类任务通过更细粒度地将文本进行划分,且根据划分结果给文本分配两个或者两个以上的标签。这种细粒度的划分不仅更加符合现实情况,并且能够有效地提高文本的检索效率,具有广泛的研究前景及意义。处理多标签文本分类问题存在多种不同的方法,而使用深度神经网络是其中最主要的处理方法之一,同时也是研究的热点之一。使用神经网络处理多标签文本分类问题主要通过,文本表示学习和挖掘标签间潜在相关性实现。文本表示学习是指通过网络模型来挖掘文本特征和建立文本内容中的潜在语义联系,通过该过程来提高模型分类的精度。挖掘标签之间的潜在相关性,是由于标签之间存在关联,通过挖掘这种潜在的相关性能够使模型在预测标签时,预测的范围更加全面并且使预测结果更加准确。对于上述两个方面的问题,本文提出一种基于词-标签概率信息的多标签文本分类模型,在文本表示方面建立卷积神经网络模型对文本内容进行特征提取;在建立标签潜在相关性方面,模型通过预先训练的标签的隐狄利克雷主题模型提取数据集中每个词的词-标签概率信息,利用双向的长短时记忆网络对提取的词-标签概率信息和标签的嵌入矩阵进行编码,编码后使用卷积神经网络进行特征提取;在预测阶段将上述两部分信息进行拼接,使用前馈神经网络预测属于文本的标签。针对卷积神经网络无法建立较长距离文本语义依赖信息,以及对于文本信息和词-标签概率信息利用不充分的问题,本文在上一个模型的基础上提出了一种基于编码和注意力机制的多标签文本分类模型,该模型首先使用双向的长短时记忆网路对文本内容进行编码,在编码后使用自注意力机制挖掘文本编码中含有的文本潜在语义信息;然后,使用预先训练的标签的隐狄利克雷主题模型获取词-标签概率信息,使用双向的长短时记忆网络对词-标签概率信息和标签嵌入矩阵进行编码,编码后使用自注意力机制挖掘潜在语义信息;最后,使用文本-词标签概率信息交互注意力处理上述两部分编码信息,获取注意力矩阵后使用卷积神经网络提取信息进行预测。实验结果表明,本文提出的模型在处理多标签文本分类问题上优于常见的分类模型,证明了本文模型的有效性。
其他文献
<正> 脂肪抽吸局部减肥术是80年代体态整形外科技术一项新进展,与措用多年传统的皮肤脂肪切除术相比,具有创伤小、瘢痕小、并发症少、安全可靠、疗效满意和患者乐于接受的优点。近2年来,
期刊
未成年人犯罪是我国高度关注的对象,其结果由多方面的复杂情况所影响。随着近年青少年犯罪趋势的走高与极端个案的出现,《刑法修正案(十一)》中面对未成年人的年龄下限修改也在2021年3月1日完成,表明了当今时代未成年人生理及心理成型的速度在加快,接触的事物多样性在上升。本文通过论述《刑法》的修改与犯罪的因素来思考下调刑事责任年龄下限这一举措。
人居环境优越的今天,楼盘的发展推陈出新,竞争激烈,住宅示范区作为销售的道具,通过实际场景达到吸引客户的目的。景观示范区需要传达的是楼盘的最核心的部分,有整体的设计风格定位、良好的空间体验感、精美的细节展示、特色的记忆点以及人性化的设计,展示楼盘的整体形象与品质。本文以永春鼎盛城上城景观示范区设计为例,浅谈住宅示范区的景观设计。
清代宫廷玉作手工艺技术在雍正、乾隆时期日益精进,对玉器的审美意趣也在此时形成了宫廷文化特色。清造办处《各作成做活计清档》详实地记录了雍正、乾隆时期玉器作坊的制造内容,其中苏州织造和苏州玉匠不仅给宫廷玉作带来技术上的革新和发展,还将明清时期苏州玉作蕴含了独特江南人文底蕴的审美文化带入宫廷,与雍容华丽的宫廷玉作审美并行交融。清代宫廷玉作审美文化在北方政治中心与南方经济文化中心的沟通交流中不断相互调适,
为了改善牙科复合树脂的各项性能,纳米填料被引入到牙科复合树脂的制作中,研究发现纳米填料的加入会对复合树脂的机械性能、美学性能、抑制龋齿、促进再矿化等方面产生较大影响。本文将对纳米填料对复合树脂性能影响及纳米填料的改进研究进展作一综述。
<正>随着乡村振兴战略深入推进,农产品冷链物流发展迅速,但同时农产品冷链物流发展面临风险,因此对农产品冷链物流过程中风险问题的研究,具有重要实践价值。利用半结构化访谈和问卷调查法对农产品冷链物流发展的风险进行辨识,采用失效模式和效应分析方法对风险进行分析。结果表明:农产品冷链物流发展的风险是多因素叠加造成的。这表明农产品冷链物流风险亟待控制。最后,从投资风险预警、供应链计划决策、标准化减损、监管共
期刊
为解决家园对幼儿学习品质认识不清,对幼儿学习品质培养途径、策略不明的问题,通过文献研究法、案例分析法、行动研究法,研究和实践家园“互融共生”模式。研究结果显示,幼儿学习品质得到了有效提升、教师家园共育专业能力明显增强、形成了区域范围内“互融共生”家园态势、推进了区域范围内园所特色发展。最后指出研究的不足,并进行发展展望。
乌卡时代,聚焦于动态即时反应的组织即兴研究成为战略管理领域的新热点。然而,已有研究多忽略时间性因素,难以动态地跟踪组织即兴随时间的涌现、演化和终止,从而无法将组织中偶发的即兴行为建构成为可以支撑企业可持续发展的长期战略。本文应用意义建构理论,对链家即兴战略的发展过程进行深入纵向过程性案例剖析,探讨即兴行为组织化的路径和结果。研究发现,即兴行为可以经由组织化演变成为企业即兴战略;这个过程要求组织即兴