基于深度学习的弹幕文本情感分析

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:guohaoyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今这个信息爆炸的大数据时代,互联网用户不同于过去那种被动接收外界信息的人群,而变为了主动在网上表达观点和分享心得。现在用户在得出结论之前,都会参考相关的评论与心得得出结论。在广泛的互联网信息中心搜寻自己需要的重要信息,这可以说是每个人的必备能力。近些年来对于传统文本的情感分析络绎不绝,取得了长足的进步,并有效协助用户本身的决策。最近一段时间弹幕视频与直播行业蓬勃发展,弹幕已经变成了用户之间在网络上互相交流与讨论的常用工具,但是用这种具有时间序列特征的文本数据进行情感分析,国内外对此仍然研究甚少。最近经常出现的一些直播事故也使直播存在的安全隐患问题逐渐浮出水面。当前对于各大主流直播平台而言,它们的监管形式仍然属于人力监管状态。人力监管的主要监管手段是监管人员流动监察或是接到观众举报,但是这也导致了一个问题:同一时段的直播间数量非常大,并且接到的无意义的用户举报有时也会浪费监管的人力,这种现象也造成了直播事故公关的极大的滞后性。网络上经常流出的某些不雅视频或照片正是人力监管已经不能满足直播平台监管需求的重要体现。深度学习算法与传统的机器学习方法比较来说能够更加行之有效地解决梯度下降、过拟合等难题,并且它在文本分析领域也具有更加良好的表现。根据直播平台出现的这一现状本文提出了基于深度学习的情感分析模型。对从直播平台获取的弹幕文本数据进行预处理后,使用Word2vec训练得到词向量,并进行模型的构建。本文使用了 CNN、RNN中常用的BiLSTM以及改进的BiLSTM-Attention三种深度学习的模型进行实验,对比和评估三种模型得到最优的模型。本文首先通过爬虫技术爬取到弹幕文本数据,随后对文本数据进行预处理操作,即对输入的弹幕文本进行过滤无意义弹幕、弹幕分词以及去停用词,在弹幕文本被加工完之后,词向量就开始得到构建。对Word2vec进行相关分析与操作之后,就建立了相关模型,这个模型是在深度学习之前才得以建立的,之后就开始进行情感分析模型的构建。之后对模型进行评估,找出适合应用于实践的深度学习模型。直播平台可以设立一个阈值,当弹幕的负面评论出现率高于该值,便可以及时监察该直播间,必要时可以采取措施及时封禁直播间。基于此模型可以达到减少人力成本,及时监察并做出应对措施的作用,可以极大地降低出现直播事故的概率。平台也可以根据模型计算出的数值,重点关注潜在的出现直播事故可能性较大的直播间,避免平台的形象受损。此篇文章对弹幕文本数据做出相关的梳理与探索,实验表明构建的基于BiLSTM-Attention的情感分析模型相比于基于CNN和BiLSTM的弹幕词语分类模型在本文的数据集上有着更高的准确率,对弹幕的实时监测更加有效,具有一定的直播平台使用价值。
其他文献
环境退化与经济发展之间的关系受到了越来越多专家和学者的关注,因此也成为很多专家学者探讨的经典话题之一。是因为从政策角度看,确定经济发展与环境质量之间的关系具有重要意义。碳排放导致的全球变暖严重影响了环境和经济的可持续发展。大气中温室气体的浓度在2000年稳定下来,但自21世纪以来全球温度仍将以每年0.5摄氏度的速度上升,并且由于热膨胀,海平面也在不断上升。因为极端气候事件爆发比以前更加频繁,全球变
学位
大连市从2014年开始对房屋的购买进行限贷,2018年至2019年先后出台限购、限贷政策,2019年大连楼市调控最为严格,在7月实行“限购”“限贷”政策叠加。同时,大连连续出台的溢价上限政策,表面使得土地价格走低,但是实际上土拍市场价格高涨,使得房地产业的开发成本增加,同时土地的可开放数量也在减少。而且从现在的房地产开发情况来看,新建楼房开始向远离城市中心的外郊进行建设,从而导致其交通便利性较差,
学位
沃尔夫冈·阿玛德乌斯·莫扎特是奥地利作曲家,同时也是德国民族歌剧的奠基人。他的一生创作了大量的经典之作,其中包括歌剧、交响乐、协奏曲、歌曲等。而咏叹调这一体裁的作品他一共创作了54首,所占比重仅次于他创作的歌剧,具有较高的艺术性和文学性的研究价值。莫扎特的音乐风格遵循着古典主义时期的音乐特征:音乐语言严谨朴素,用理性和谐的形式表达真挚淳朴的情感,同时又具有浓郁的个人审美风格和独特创作风格,他的作品
学位
物流一词起源于上世纪30年代的美国,后经日本流入中国,经过不断的发展和完善,目前物流涵盖了七大部分:运输、库存、包装、装卸、流通加工、配送以及信息管理等环节。而作为现代运输主要方式之一的货物运输,是运输系统中重要关键的环节,特别是国家和政府提出推进“一带一路”建设的重大决策后,货物运输发挥着至关重要的作用。交通运输部认真贯彻学习了 2017年习近平总书记在“一带一路”国际合作高峰论坛开幕式上的讲话
学位
为了面对当今迅猛发展的互联网环境与大数据技术并将大数据内涵的丰富深刻的价值进行挖掘与转化为现实的经济效益,推荐系统作为广大新兴应用技术中深植于人们群众日常生产生活并且已经基本无法脱离的一部分,是大数据应用无法逃避的讨论话题与组成部分。推荐系统以解决“信息过载”问题为出发点,在多种领域为客户提供他们可能感兴趣或有意浏览的内容,例如淘宝网的产品页面中的相似商品推荐列表,并且一般而言,推荐系统可以分成三
学位
为了弥补传统方法设计宽频超材料吸波体存在重复试验和设计周期长的缺陷,提出用拓扑优化方法来设计宽频超材料吸波体,通过改变表层拓扑结构以实现工作带宽的灵活调节。采用离散编码的方式进行拓扑编码化,通过一种结合动态权值和高斯误差的二进制粒子群算法优化拓扑结构,以实现C-Ku内任意工作频段的高吸波率。所设计的2种超材料吸波体在8.2~16.6 GHz和7~13 GHz频段的吸波率高于90%,尤其在X频段内,
期刊
随着互联网的不断发展,我国的电商平台已经连续7年成为全球最大的网络零售购物市场。电商平台规模不断扩大,涉及的领域也不断地扩大,给人们的衣食住行带来极大改变和便利,人们也越来越离不开电商平台提供的商品和服务。然而在电商平台不断壮大和在国民经济发展中的地位不断提升,电子商务发展也面临着许多问题。其中一个问题是,随着信息技术和电商平台的快速发展和电商平台商品种类的增长,电商平台不仅给用户带来便捷的产品和
学位
行人检测作为计算机视觉领域的一项关键技术,在许多领域实现应用落地,如人体行为分析、智能交通、智能视频监控、智能机器人等。在辅助驾驶领域,行人所处环境是在户外的,室外天气变化多端,使得交通场景中的行人识别一直是一个重要的研究课题。本文重点对基于神经网络的交通场景行人检测算法进行研究,以提高检测精度、保证检测时间为目标,提出一种改进的区域候选网络,用于检测交通场景下的行人。(1)建立交通场景下的数据集
学位
移动技术迅速发展和手机用户快速增多,吸引大量运营商将资本投入到APP(Application,手机应用程序)的研发上。教育作为国之大计,教育事业的大力发展是发挥我国人力资源优势、提高全民思想道德素质和科学文化素质的必然选择。基于移动客户端APP在手机上不受时间和地点等因素限制的特点,在线学习类APP快速发展并受到广大学习热爱者的欢迎。在线学习类APP蓬勃发展的趋势,吸引更多资本注入,造成各大在线学
学位
黄自是我国早期专业音乐教育的奠基人之一,也是中国近现代音乐史上影响深远的作曲家和音乐理论家。他的创作涉及管弦乐、清唱剧、合唱歌曲、独唱歌曲等多种音乐体裁,还曾先后主编《音乐杂志》和《新夜报·音乐周刊》,并创办了上海管弦乐团,培养了贺绿汀、陈田鹤、江定仙、刘雪庵等一大批优秀的音乐人才,为我国近代音乐教育事业的发展,繁荣我国近现代音乐艺术的创作作出了不可磨灭的贡献。在黄自创作的丰富多样的音乐体裁中,艺
学位