论文部分内容阅读
网络信息可信度关乎决策的有效性程度。近年来,以互联网为代表的新媒体获得了迅速发展与广泛普及,社交媒体,如社交网络(SNS)、微博、微信、博客(Blog)等,以其独有特征——用户生成内容(User-generated content,UGC),成为网络信息发布的主要渠道。由此带来的各种“标题党”、“网络谣言”、“假新闻”等虚假消息,使得大众对网络信息内容的真实性产生某种程度的怀疑。因此,研究网络信息内容的可信度从而帮助大众快速获取有用信息有着重要的意义。目前,社会化媒体网络信息可信度的相关文献主要是侧重于对影响因素进行实证分析的探索性研究。影响因素如信息的专业性、准确性、公平性、透明性等都会直接或间接影响信息内容的可信度;另外,相较于言语信息,带有视觉信息的在线评论的信息内容质量和信誉明显会获得更高的评价。虽然已有的研究成果推动了信息内容可信度评估的研究与发展,但仍存在一定的局限。因此,本文的研究问题主要涉及两个部分:(1)现实问题:社交媒体的迅速普及,自下而上的大众参与所形成的用户生成内容,造成杂乱、碎片化的网络信息内容,加剧了网络虚假信息的生成及传播。面对海量动态信息的真实性测度困难的问题,提供测度网络信息内容的可信度的方法;(2)科学问题:已有的定性评估缺乏定量程度的测度,本文根据信息用户基于其认知经验对信息内容进行社会化标注及评价所产生的客观性行为数据,构建定量的、客观的可信度测度模型。在社交媒体环境下,本文分别考虑了参与者规模、条件属性个数、参照对象个数这三个因素,分别基于贝叶斯推理理论、贝叶斯网络理论和迁移学习理论,构建网络信息内容可信度场景性测度模型,主要研究内容包括以下几个方面:(1)基于贝叶斯推理理论,构建能够利用已有经验及证据性数据的网络信息内容可信度的测度模型;基于贝叶斯决策理论,构建可信度测度有效性的最小错误率评估模型。并且基于三个不同领域的实际数据集的实验结果表明,随着社会化媒体参与者规模增加,可信度测度的最小错误率呈下降趋势,且贝叶斯可信度测度模型总体优于传统的模糊可信度测度模型。(2)在假设参与者规模不变的前提下,考虑条件属性范围这一影响因素。基于可揭示属性之间条件性关联关系的贝叶斯网络理论,构建了网络信息内容的相对可信度测度模型。基于三个不同领域的实际数据集,模型的实验结果表明:在一定的参与用户规模前提下,随着可参照的条件属性关键词个数增加,错误率总体降低的趋势以及精确度总体上升的趋势。(3)在假设参与者规模和条件属性范围固定不变的前提下,考虑参照对象个数的影响。基于迁移学习理论,利用不同参照对象之间的条件性相关关系,构建网络信息内容的可信度测度模型,该实验结果揭示了随着参照对象个数的增加,ROC曲线总体呈上升趋势,曲线下面积AUC值越来越大的变化趋势,并且迁移学习模型优于模糊测度模型。鉴于网络信息内容可信度测度所涉及的影响因素较复杂,已有的可信度测度模型仍存在一些在未来的研究中需要进一步改进的工作。