【摘 要】
:
借助于互联网新媒体传播的信息为人们的日常生活以及社会经济活动、企业组织决策、政府公共管理等提供了海量的信息来源和极大的便利。然而,信息噪音问题,包括不实信息、浮夸信息等在互联网和新媒体时代尤为突出。这其中,作为当前国内最具影响力的移动网络社交平台,微信及运行于微信上的公众号已经成为新媒体时代的重要流量阵地,不少公众号为了增强订阅粉丝的黏着度,采用大量浮夸自大、华而不实的文风套路,造成了不良的经济和
论文部分内容阅读
借助于互联网新媒体传播的信息为人们的日常生活以及社会经济活动、企业组织决策、政府公共管理等提供了海量的信息来源和极大的便利。然而,信息噪音问题,包括不实信息、浮夸信息等在互联网和新媒体时代尤为突出。这其中,作为当前国内最具影响力的移动网络社交平台,微信及运行于微信上的公众号已经成为新媒体时代的重要流量阵地,不少公众号为了增强订阅粉丝的黏着度,采用大量浮夸自大、华而不实的文风套路,造成了不良的经济和社会影响,浮夸文风问题亟待改善。因此,本研究以语言学相关理论为主要依据,对文本风格提出了一种基于文本要素的多维测度体系,并以微信公众号文章为样本,进行了文本风格检测方案的设计与检验。研究主要分为三个层次:(1)理论层面,以语言学相关理论为主,综合不同学科视角,对文本风格的要素进行分析,构建了多维文本风格测度体系,并结合具体语料范例进行个案分析;(二)方法层面,在文本风格测度的总体流程设计基础上,重点设计了先验知识库——文本风格词典(TSD)与Word2Vec相结合的词向量构建方法以及基于Bi-LSTM的文本风格检测模型;(3)应用层面,首先,本文在自动化采集微信公众号文章的基础上,通过jfinal+Vue.js开发数据标注平台,并对所采集的语料(小语料)文章进行多维文本风格标注,与此同时,采集百科类问答文章数据作为大规模通用语料库(大语料);其次,结合现有词典资源,辅以人工修正,构建文本风格词典(TSD);然后,作为本研究的实验重点,对基于小语料以及大语料的Word2Vec词向量构建结果进行实验对比分析,对文本风格检测的Bi-LSTM模型基于实验进行参数优化,通过传统分类方法SVM、小语料Word2Vec+Bi-LSTM、融合小语料和大语料的Word2Vec+Bi-LSTM、TSD+小语料Word2Vec+Bi-LSTM以及TSD+融合小语料和大语料的Word2Vec+Bi-LSTM等不同多目标分类实验的综合对比分析,对所设计的文本风格检测流程和方法进行验证和评价。研究结论表明,(1)理论上,本研究所构建的文本风格多维测度体系具有一定的可解释性和可理解性;(2)以Bi-LSTM为代表的深度学习模型能够有效地对文本风格进行多目标分类,表现出比传统机器学习方法更优的性能;(3)较之于独立地运用微信公众号文章语料,通过融合更大规模的通用语料,Word2Vec词向量构建以及BiLSTM文本风格分类的效果进一步提升;(4)较之于独立的Word2Vec词向量构建,通过构建先验知识库——文本风格词典(TSD)并拼接TSD和Word2Vec词向量,基于Bi-LSTM的文本风格分类效果显著提升。
其他文献
引文上下文中含有被引文献的重要信息,如研究方法、研究结论和研究不足等,已被广泛应用于自动摘要研究工作中。然而,由于引用动机的不同,不同的作者对被引文献的描述也存在较大差异,使得引文上下文难以全面准确地反应被引文献的内容。近几年来,多项测评比赛,如CL-Sci Summ Shared Task、TAC 2014(国际文本分析会议)等均提出了基于科技文献中的被引片段的结构化摘要生成方法。被引片段是指引
聚类分析是一种无监督的机器学习算法,在无标签的情况下对一组数据点进行聚类分组,分到同一组中的数据样本具有相似的特征,不同组的样本之间特征差异较大,其主要任务有关于距离函数的选择,最优聚类数(K值)的选择等。半监督聚类是利用半监督学习方式提升聚类模型效果的方法,它能够利用数据集的部分标签信息学习到更优的初始聚类中心、距离度量等重要影响因素。并且也能够监控聚类过程,不断迭代优化模型参数,以达到提高模型
无人侦察器因其便利、安全、高效、可靠等特点在军事侦察、环境侦测、消防搜救等领域得以广泛应用。为了满足未来多领域协同化、立体化侦察的要求,本文提出了一种分离式三栖无人侦察器,并围绕其机械结构设计、飞行动力学模型建立、控制算法、识别算法等方面展开了研究。针对空域侦察器飞行空间受限、环境适应性差;陆域侦察器受地形影响的问题,提出了一种三栖分离式机械结构的侦察器。通过设计一种分离机构将两栖小车与普通无人机
国产大女主电视剧产生于上世纪90年代,自2012年《甄嬛传》掀起收视狂潮后,国产大女主电视剧不断完善类型化叙事,从原有的戏说历史剧和宫斗剧分类中剥离出来,成为一种独立的类型剧被大众所认识。日渐繁荣的新媒体环境为国产大女主电视剧在新时代的发展与传播提供了必要条件,助推该类型剧迅速在我国电视剧市场占据重要份额。鉴于此,为国产大女主电视剧的良性发展与其他类型电视剧提供借鉴起见,对新媒体环境下国产大女主电
整体增材制造技术是基于增材制造技术和自动化嵌入技术提出来的一种一体化制造功能电子产品的新方法,该方法采用增材制造技术打印产品的结构和电路部分,在打印过程中辅之自动化技术嵌入电子元器件,实现功能电子产品的“结构-电路-组件”一体化成型。因其高的设计、制造自由度优势,在航空航天、医疗装备、智能电子产品、可穿戴设备等领域具有广泛应用前景。在整体增材制造中,将自动化嵌入技术同增材制造技术有效集成是工艺的难
盘式刀库及其自动换刀装置是数控机床关键功能部件之一,其可靠性直接影响数控机床的可靠性,故面向其可靠性的关键技术研究具有重要意义。本文在国家重大科技专项“高档数控机床与基础制造装备”项目“数控机床关键功能部件可靠性增长工程”资助下,研究盘式刀库及自动换刀装置关键性能监测技术、性能变化规律、以及可靠性试验和评价等问题,为其可靠性增长提供理论依据和改进方案。全文主要取得以下成果:(1)搭建盘式刀库及其自
金属铝与水反应可以产生大量氢气,同时放出热量。铝/冰固体推进剂(ALICE)是一种新型绿色高能推进剂,具有成本低、安全性高、环境友好、制作工艺简单等诸多优点,在空间推进、水下推进和快速制氢等领域有望得到应用。为了对金属铝在高能推进剂中的应用有较深入的认识,本文对铝/水推进剂的燃烧特性进行了模拟研究,分为以下三个部分。(1)利用ReaxFF力场对纳米铝颗粒与水的反应进行了分子动力学模拟。Al/H2O
民事案件程序分流是通过构建分层递进、层层筛选的分流"漏斗",为不同民事案件匹配合适的程序轨道,以达到优化司法资源配置、提高司法效率的效果。民事案件程序分流是由法官主导,并在当事人的协助和律师的参与下完成。民事案件程序分流必须严格遵循民事程序基本法,充分保障当事人的合法权益,并遵循集约化处理和限制"二次分流"的原则。现阶段世界范围内的民事案件程序分流主要依据案件类型、案件标的额和案件难易程度三大标准
加工表面状态在γ-TiAl合金的实际生产应用中具有重大的意义。本文采用机械加工的方式处理试样表面状态,系统研究了γ-TiAl合金在室温和高温下的抗弯强度、室温拉伸疲劳寿命、室温弯曲疲劳寿命基于加工表面粗糙度变化而变化的趋势,并分析了在不同断裂形式下γ-TiAl合金的裂纹萌生、扩展及合金发生最终断裂的机理。研究了基于加工表面粗糙度和环境温度的全片层γ-TiAl合金抗弯强度变化规律及其断裂机理。室温下