基于LSTM的虚假新闻检测系统的研究与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hghkjhnnggh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的日益普及,互联网已经成为广大人民获取新闻咨讯的主要途径。同时,社交媒体平台在使用上具有很大的便携性,使得任何一个使用互联网设备的用户在阅读资讯内容的同时,可以随意发表自己对事件的观点和感受,这造成了一个信息爆炸的局面,在社交媒体平台上每一分钟都有大量的信息发布,而且信息的传播速度极快,很快会被大量转发。在海量的信息中,包含大量的不实信息,这些不实信息带来的影响经常是负面的,给社会秩序和舆论带来的影响,甚至造成社会的不稳定。因此,对于社交媒体上的新闻进行真伪的识别对于企业以及政府部门来说尤为重要。本文在对自然处理相关理论包括自然语言处理的基础模型、词向量模型、注意力机制等理论方法介绍的基础上,首先分析了循环神经网络(Recurrent Neural Network,RNN)模型在长序列的处理过程中存在梯度不稳定以及对较早时间步的输入信息不能很好地兼顾等问题,引入了一定程度上能弥补RNN模型缺陷的长短期记忆神经网络(Long short-term memory,LSTM)模型和LSTM模型的变体门控循环单元(Gate Recurrent Unit,GRU)模型,提出并建立了一种基于线性的双向LSTM(Bi-LSTM)的深度学习模型,分别从微博内容和微博评论进行特征提取,结合集成学习的思想将这两部分特征进行融合,同时用双向GRU(Bi-GRU)模型进行对比实验。接着分析了线性模型不能很好地学习到自然语言文本中的语法结构特征,因此由句法分析相关理论技术引入了能更好地学习到句子当中语法结构特征的树形长短期记忆神经网络模型,提出并搭建了一种基于Child-Sum Tree-LSTM的模型,通过实验验证了模型的可行性和优势。进一步地,加入注意力机制(Attention Mechanism),以快速提取数据中有价值的信息、提升模型的训练速度和准确率,通过实验对比发现这种Tree-LSTM结合Attention机制的模型更具有效性,最后以此模型为基础设计并实现了一个基于LSTM模型的虚假新闻检测系统。
其他文献
目的 探讨乳腺及子宫卵巢彩超检查联合血清性激素对性早熟女童的诊断价值。方法 选取2018年1月至2022年2月于新余市人民医院检查就诊的106例性早熟女童作为研究对象,根据促性腺激素释放激素(Gn RH)激发试验结果,将女童分为特发性中枢性性早熟(ICPP)组(n=58)和单纯乳房早发育(PT)组(n=48)。所有女童均接受乳腺及子宫卵巢彩超检查和血清性激素水平检测,比较分析两组女童的乳腺及子宫卵
期刊
“无名”回忆录作品在全球掀起风潮。由于没有名人回忆录作者的光环,“无名”回忆录需要借鉴小说的叙述技巧来提升故事的吸引力。经典叙事学研究的中心对象为小说,其中以热奈特为代表的叙事学派主要的研究对象为叙述话语。而在经历了“经典向后经典”的转型之后,叙事学拓展了自己的研究范围,接纳了非虚构作品,同时开始走出文本走向文化语境。本论文以回忆录作品Wait for God to Notice节选部分的英汉翻译
学位
风能、太阳能等清洁能源发电在总发电量中的比例越来越大,但这些能源在发电系统中存在着惯量低、随机性和间歇性等问题。微电网概念的引入找到了解决问题的新思路。但是,微电网的功率分配问题和不确定性能源接入电网造成电网波动以及接入电网以后的经济性问题仍然困扰着人们。本文在保证微电网的稳定的前提,对系统进行无功优化,然后考虑分布式能源的不确定性,采用多目标优化算法,提高了微电网的清洁性、经济性和风光出力的平稳
学位
流利性是评估口译质量的重要标准。对于汉语是母语而英语是外语的译者,在进行汉英口译时较容易产生非流利现象。大量的前人研究多集中于同传领域,或是针对同一级别的学生译员。鉴于此,本研究旨在探讨在汉英交传领域不同级别的学生口译员可能会出现哪些非流利现象,同时探讨导致这些非流利现象的不同因素,并提出对应的策略。本论文首先分别对一组通过全国翻译专业资格水平三级考试的学生译员和一组通过全国翻译专业资格水平二级考
学位
新能源汽车能够有效缓解传统汽车行业对化石燃料的严重依赖和全球所面临的环境问题,是未来发展的必然趋势.驱动电机作为新能源汽车的动力核心,不仅需要具有优异的磁性能提高能源转换效率,同时需要具有高强度来抵抗高速运转时的离心力.然而,无取向硅钢的强度和磁性能难以兼顾,因此无取向硅钢力、磁性能的协同调控是新能源汽车驱动电机发展过程中的一个关键科学问题.本文综述了国内外有关高强无取向硅钢力学性能和磁性能调控的
期刊
由于全球环境恶化和人类生活习惯不规律,癌症的发病率已经逐年上升,严重损害到人们的身心健康,急需对肿瘤的有效治疗手段。目前虽然有多种治疗肿瘤的方法,但手术治疗会产生多种并发症,放疗会引起放射性肺炎,化疗对正常细胞及器官组织也有损害。光热治疗就作为一种安全可靠且成本可控的肿瘤绿色疗法而出现,但为了避免光热治疗过度而急需一种非侵入式实时准确的温度测量手段。光声成像技术因为其高对比度和高空间分辨率且与温度
学位
索引可以被视为将键映射到排序数组中记录位置的模型。随着数据量急剧增加,传统索引结构在面对海量数据的查询面临着严峻的挑战。本文使用深度学习模型替换现有的索引结构,称之为学习型索引。相较于B+tree等传统结构,深度学习技术在拟合数据分布,提高并行度方面有突出的优势。学习型索引在搜索时间上比B+tree效率更高,在内存占用上则占用更小的空间。但是,仅限于静态工作负载。针对学习型索引在动态工作负载上的可
学位
先天性心脏病是最常见的胎儿出生缺陷疾病,对其胎儿期筛查可以早发现早治疗,减少并发症和降低死亡率。超声是筛查胎儿先天性心脏病最主要的医学影像手段,具有无辐射、可同时评估结构和血流情况等优势。近年来,随着人工智能技术的发展,基于深度学习进行胎儿心脏病筛查,可以学习优秀医生的诊疗经验,为先心病筛查提供辅助诊断,同时还可以缓解医疗资源分布不均衡等问题。本文研究基于深度学习的胎儿心脏病辅助诊断,主要包括胎儿
学位
学习能力是核心素养发展的关键要素。本文从学习能力视角,厘定教学关键问题,制订评价指标体系,从作业的内容、形式、实施过程等方面探究作业优化设计:阶梯式作业,在任务进阶中培养积极的学习情感;听读型作业,在循环复现中培养良好的学习习惯;实践类作业,在问题解决中有效运用学习策略。
期刊
阵地进攻是篮球比赛的主体,阵地进攻的成功率反映了球队的进攻实力和战术素养。其中无球掩护配合是篮球比赛中重要的配合之一,是当今篮球发展趋势下必不可少的进攻手段。CUBA作为中国大学生篮球水平最高的赛事,许多球队存在阵地进攻成功率低、进攻出手不合理的问题;许多大学生球员对无球掩护配合的功能认知不清晰、使用不到位。因此本文希望通过研究探究大学生男子篮球比赛中无球掩护配合给阵地进攻带来的影响,帮助大学生球
学位