涉及未登录词的网络舆情多模态数据处理方法研究

来源 :西南民族大学 | 被引量 : 0次 | 上传用户:iamasg_wql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络社区中产生的舆情信息包括大量文本、图片和视频等多种模态数据,其传播方式具有随意性、快速性、便捷性等特点,是社会舆论的聚集地,其中未登录词处理是影响网络舆情分析的一个重要环节。本文针对网络图片中涉及未登录词的网络舆情展开分析,从图像文字识别、文本处理、舆情分析等多角度展开研究。本文的主要研究工作和相关结论如下:1.本文分析了涉及未登录词的网络图片的特点,并多角度地探索网络图片与网络舆情、未登录词相互之间的关系。通过网络爬虫和手动标记的方式采集相关数据,运用结合分词技术的Ocr图片文字识别算法有效获取网络图片中的文本数据。2.本文提出了一种双向指向性替换模型,根据文本中未登录词的特点使用了两个输入层来进行替换处理,一层是基于Word2vec语义分析的近义词替换列表,另一层是基于Text Rank提取关键词的替换列表。该模型结合时间序列并基于TF-IDF加权朴素贝叶斯分类器。通过实验得出,在涉及未登录词的舆情事件中,该模型比传统方法具备更好的分类效果,能准确识别出未登录词在网络舆情中的动态变换,该模型不仅能够对涉及未登录词的舆情进行文本分类,也能够基于时间序列的变换而对舆情进行实时分析。3.本文从来源网络图片与网络文本的舆情信息为出发点,不局限传统文本数据,而从文本、图像及两者融合三个方面进行多模态数据的研究。在合成数据集和公开数据集上进行了实验,并进一步构建混杂网络图片和文本的实验应用,结合未登录词的词性、类别、粘合度、时间序列、词频等特征对涉及未登录词的网络舆情进行了有效分析与判定,并进一步证明了本文所构建模型的有效性。
其他文献
研究以陆地资源卫星Landsat系列为数据源,以文献综述的形式归纳了现有建成区定义,探索了其边界划分的方法,实施了中心建成区的遥感影像提取,并进行了县域中心城市空间扩张分
目前,高强钢筋在建筑工程中的应用越来越多,推广高强钢筋有助于建筑结构的发展。高强钢筋与普通钢筋相比,具有强度高、工艺性能和延性性能优良、节能环保和使用寿命长等优点
根据词性不同,汉语同形异义词可以分为同词性歧义词(比如“台风”)和不同词性歧义词(比如“制服”)。歧义消解的研究主要探究词频和语境在歧义消解过程中的作用,尽管研究不少
随着建筑信息化的不断深化,工程建设项目正朝着规模化和集成化方向发展,施工进度管理与材料管理的重要性愈发明显。在此背景下,引入BIM技术提高工程建设项目管理水平,现已成为引导建筑行业变革的主要推动力。本文以施工进度与材料管理为研究对象,探索基于BIM的集成优化研究方法,并在工程实践中加以实证。在文献、书籍、行业报告及工程案例查阅的基础上,综合分析了国内外在施工管理与材料管理及BIM技术的研究现状,概
2004年,研究人员首次在实验上制备了石墨烯,自此引发了对二维材料研究的新热潮。由于石墨烯所具有的优异的物理性质,它被看作最有可能的硅材料替代者。而二维石墨烯材料为无带隙半金属,为了打开其带隙,对石墨烯进行功能化成为了研究的必经之路。与此同时,石墨烯的发现也在一定程度上鼓励了研究人员对新二维材料的制备和研究。本文采用基于密度泛函理论的第一性原理的计算方法,对功能化的石墨烯纳米带和一维类石墨烯纳米材
近年来,化石能源枯竭的情况日益加剧,温室效应对人们生活的影响越来越严重。因此,将可再生资源向增值化学品的转化越来越受到重视。从绿色化学以及可持续发展的角度出发,采用
本文以社会现象观察与文本分析相结合的方法,研究了学者较少涉及的净土宗第十三祖印光法师的净土思想,梳理了印光法师专修净土法门的原因、密护其他宗派的方法以及处理儒佛关系的策略。正文分为三大部分。第一部分主要讨论印光法师净土思想形成的背景与主要内容。面对近代社会旧礼教的崩坏以及西方文明的冲击,印光法师从信仰的角度以其净土判教观与修学观提出治理社会的一套新方法、新体系。净土判教观认定净土念佛法门乃“特别法
土王崇拜是湘西土家族祖先崇拜与英雄崇拜在土司时期的延续和发展,是土司制度在宗教层面的投射,是土司文化的重要组成部分,在湘西土家族社会具有深远的影响。选取湘西土家族土王崇拜作为研究对象,通过系统梳理湘西土家族土王崇拜的全貌,分析土王崇拜的成因,探讨土王崇拜的社会功能,一方面有助于丰富土司文化的研究,另一方面有助于以此为例探讨宗教和政治的关系,并对土司文化资源的保护和开发有一定的参考价值。通过研究,可
三维激光扫描技术(Three-Dimensional Laser Scanning)被称为继GPS空间定位技术后又一项测绘新技术的突破,它通过高速激光扫描的方法,可以快速获取被测物体表面的大量密集点
泡沫在热力学和动力学上都处于不稳定状态,因此提高泡沫的稳定性在泡沫驱中是一个急需解决的关键问题。纳米SiO2作为新型的稳泡剂凭借其独特的优势而得到了人们的青睐。目前