论文部分内容阅读
如今,高速发展的社交网络逐渐成为谣言滋生与传播的温床,在此环境下,谣言传播的速度和扩散的范围不容小觑。网络谣言不仅会干扰人们的日常生活,损害某些企业和单位的信誉与利益,还可能引起大规模的恐慌与骚动,对于国家安全与社会稳定都有极其恶劣的影响。网络谣言中,健康养生类谣言占比极大,主要围绕着食品安全、生活习惯的优劣、疾病的预防与治愈等主题展开,与人们的健康关联紧密。为了探索健康养生类谣言有何特征,本文选择了 100篇健康养生类谣言为主要研究对象,再结合100篇权威可信的同类科普文章进行多角度的对比分析,总结出健康养生类谣言的各种特征,为网络谣言的自动识别、筛查、人工辨别等提出有效的建议。具体而言,本文从标题与正文两个部分,对这类谣言文章与科普文章进行了对比分析。对于文章标题,本文总结了谣言文章标题与科普文章标题在标点符号、词类、句式、句类方面的倾向。对于文章内容,本文对比了谣言文章与科普文章的长度和词语丰富度的具体表现,分类总结了两类文章主题的分布特点,分析了不同词类中前三十位高频词的具体特征,利用TF-IDF算法对比了两类文章的前二十位关键词,利用余弦相似性计算方法比较了谣言文章与科普文章内部以及相互之间的文本相似度,利用情感分析对比了两类文章中褒义、贬义、中性句子的组成情况。通过上面的分析,本文给出了健康养生类谣言的识别与筛查建议,并对健康养生类科普文章的优点进行了归纳总结。最后是总结部分,概括了本文研究的成果,提出了本文可以进一步改进的地方与对将来研究的展望。