基于深度学习的蒙古文新闻文本分类与倾向性分析研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:wenwen0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息爆炸的当下,挖掘有效信息成为巨大挑战,新闻媒体正是大众获取信息的重要渠道之一。而新闻文本分类、倾向性分析可适用于新闻线索收集、舆情监控、决策辅助、有害信息过滤、运营分析、专题分析及新闻推送等领域,能够有效帮助用户快速、准确地获取所需信息,帮助新闻媒体在茫茫数据中分析出规律和关联项,达到便捷快速处理新闻的目的。文本分类及情感倾向性分析目前在国内外研究较多,发展相对成熟,但是蒙古文相关研究的起步较晚成果较少,随着蒙古文信息化的发展,蒙古文网络新闻内容逐步丰富,对蒙古文新闻文本分类及情感倾向性分析研究成为重要课题。本文的研究目标是基于深度学习的方法,对蒙古文新闻文本进行分类及情感倾向性分析研究,并基于研究成果设计和实现蒙古文新闻文本可视化系统。首先,通过爬取、翻译和预处理等流程构建了蒙古文新闻文本数据集,并采用word2vec模型词嵌入训练进行特征表示,来提高模型准确度。其次,对蒙古文新闻文本的分类模型进行了对比研究。以word2vec预训练的特征向量分别输入到LSTM、Bi-LSTM、W-LSTM、W-Bi LSTM模型进行蒙古文新闻文本分类对比实验。最终选取分类效果最好的W-Bi LSTM模型作为蒙古文新闻文本分类模型和蒙古文新闻文本倾向性分析任务的基准线(baseline)。再次,构建了对蒙古文新闻倾向性分析模型。本文以正面、负面及中性对蒙古文新闻的情感极性进行划分。通过构建Bi-LSTM+注意力机制的模型进行倾向性分析。注意力机制在新闻情感倾向分析中的应用不仅可以提升深度学习模型的性能,还可以可视化模型的注意力得分,能直观的看到整个文档中的哪些部分被模型赋予了较高的权重。最后,设计和实现了蒙古文新闻文本可视化系统。本文设计了一个新闻文本可视化系统,采用上述训练的基于深度学习的模型和word2vec统计功能,通过Flask+pyecharts实现了包括柱状图、雷达图、地图、饼状图、Attention可视化等方式对蒙古文新闻文本进行多维度分析,并展示判定依据和判断结果。
其他文献
按照中央宣传部提出的“2020年底全国基本实现县级融媒体中心全覆盖”的时间表,此时县级融媒体中心建设已经进入最后阶段。2018年,习近平总书记在全国宣传思想工作会议上指出:“要扎实抓好县级融媒体中心建设,更好引导群众、服务群众”。自此,媒体融合开始深入到基层传播格局中,县级融媒体中心的建设成为国家打通基层群众“最后一公里”融合发展的重要战略目标。两年来,我国县级融媒体中心建设在政策支持、理论研究与
随着移动互联网不断成熟和中国人口老龄化进程的不断加剧,越来越多的老年人参与到了移动互联网发展的浪潮之中。凭借着低门槛和去中心化的互联网场域,老年群体可以利用各种媒介来表达自我、展现自我。同时,他们也在互联网掀起了一股“老年网红”的热潮。健康的老年生活需要老年人参与到社会活动之中,作为数字化时代的弱势群体,“老年网红”的崛起让社会以及公众看到了老年人融入互联网的可能性。本文从传播学的视角出发,研究“
Vlog作为一种短视频,2018年逐渐流行于我国各大视频网站,成为众多原创视频制作者选择记录分享生活、传播信息的新方式。央视等主流媒体也在Vlog短视频的潮流下,将新闻与短视频融合,进行了诸多内容与形式上的创新。这种传播方式的转变,使新闻报道中严肃的话语模式变得有温度、接地气,受到广大年轻群众的喜爱。同时,Vlog新闻在实践方面存在的不足也受到一些学者和新闻工作者的重视,并深入研究。本文主要运用的
习近平总书记指出:“当今世界是开放的世界,当今中国是开放的中国。”21世纪,各国之间的联系越来越密切,日益成为一个利益共享、职责共担的命运共同体。我们关注的眼光不仅仅局限于眼前,也要把握更加宽广的国际视野。2020年,新冠肺炎疫情大爆发,人民面对新冠病毒的挑战,消极情绪容易滋生和蔓延,情绪传播更需要一个“积极情绪”的引导,人们的报道关注焦点集中在新冠疫情的信息上来。社交媒体在重大公共卫生事件报道中
21世纪以来,工业化和城市化的发展,人口的大量激增,垃圾产量每年可达到亿吨以上,生态环境问题逐渐突出。严重的环境污染影响着国家的进步和发展,阻碍着人民的生活水平的提高,垃圾治理问题关系着改善我国城乡居民的生存居住环境。如何处理巨大的垃圾产量,已经成为解决环境问题重要的一部分。生活质量的不断提高,垃圾治理问题逐渐成为热议,有关垃圾处理问题的报道开始受到社会不同阶层的关注,影响着受众的观念意识,在改变
国防和军队的现代化与军队组织形态的现代化息息相关。党的十八大以来,我国将军队文职制度改革纳入军队人力资源改革之中。当前,随着国防和军队改革的不断深入,我国正处于军队现代化建设的关键时期,加上不断改进的军队文职人员制度,大批优秀人才涌入军营,活跃在国防和军队建设的各个领域,承担着教学科研等重要任务。党的十九大后,文职人员制度改革继续深化,2017年重新修订的《中国人民解放军文职人员条例》,标志着我军
“两会”报道作为我国具有代表性的重大主题新闻报道,关乎着新时代条件下媒体对党的路线、方针和政策的宣传引导,也关系着媒体能否拉近同新闻用户之间的距离,实现与用户的良性互动。数据新闻的可视化便为“两会”重大主题新闻报道提供了一种新的发展思路。本文在扎实梳理文献的基础上从数据新闻可视化的基本理论入手,区分相关概念,解释数据新闻可视化的定义,厘清数据新闻可视化的类型,阐述重大主题数据新闻可视化的生产流程。
美是人类永恒的追求,随着社会经济发展,生活水平提高,人们更加注重精神享受,对艺术和美的需求也体现在生活的方方面面,生活美学应运而生,它强调审美平民化以及艺术生活化,其研究对象就是活生生的生活。对于生活美学的体现与传播,短视频作为新型的艺术载体,无疑发挥了重要作用。据中国互联网络信息中心(CNNIC)最新发布的第47次《中国互联网络发展状况统计报告》显示,截至2020年12月,我国短视频用户规模为8
人脸信息被用于各种验证场所,主要是因为相比于其他认证手段,人脸信息具有唯一性、实时性和难伪造性。跟机场、火车站等一些大型场所相比,住宅小区的住户容量较小,住户信息较稳定,可以更充分发挥人脸识别技术的优势。本文设计了一种基于卷积神经网络的人脸识别门禁系统,实现无接触、快速的门禁检测。本文主要对人脸检测、活体检测、人脸特征提取和对比等方面进行了学习与研究。采用核相关滤波算法(Kernel Correl
奶牛采食行为是奶牛活动的关键行为之一,反映奶牛的健康状态与饲喂情况等。传统人工的观测只针对个人牧场,而规模化牧场只依靠人工成本较高。近几年来,随着数字化技术与人工智能的不断发展,可穿戴设备运用在了各个领域中。畜牧业中运用该方法可降低人工与资金成本,增加效率,减小损失。基于此,本文提出了一种基于活动量数据与深度学习的方法对奶牛采食行为进行识别研究,通过采集活动量数据加以分析处理并运用深度学习等算法模